Studopediya

КАТЕГОРИЯ:


Астрономия- (809) Биология- (7483) Биотехнологии- (1457) Военное дело- (14632) Высокие технологии- (1363) География- (913) Геология- (1438) Государство- (451) Демография- (1065) Дом- (47672) Журналистика и СМИ- (912) Изобретательство- (14524) Иностранные языки- (4268) Информатика- (17799) Искусство- (1338) История- (13644) Компьютеры- (11121) Косметика- (55) Кулинария- (373) Культура- (8427) Лингвистика- (374) Литература- (1642) Маркетинг- (23702) Математика- (16968) Машиностроение- (1700) Медицина- (12668) Менеджмент- (24684) Механика- (15423) Науковедение- (506) Образование- (11852) Охрана труда- (3308) Педагогика- (5571) Полиграфия- (1312) Политика- (7869) Право- (5454) Приборостроение- (1369) Программирование- (2801) Производство- (97182) Промышленность- (8706) Психология- (18388) Религия- (3217) Связь- (10668) Сельское хозяйство- (299) Социология- (6455) Спорт- (42831) Строительство- (4793) Торговля- (5050) Транспорт- (2929) Туризм- (1568) Физика- (3942) Философия- (17015) Финансы- (26596) Химия- (22929) Экология- (12095) Экономика- (9961) Электроника- (8441) Электротехника- (4623) Энергетика- (12629) Юриспруденция- (1492) Ядерная техника- (1748) Arhitektura- (3434) Astronomiya- (809) Biologiya- (7483) Biotehnologii- (1457) Военни бизнесмен (14632) Висока technologies- (1363) Geografiya- (913) Geologiya- (1438) на държавата (451) Demografiya- ( 1065) Къща- (47672) журналистика и смирен (912) Izobretatelstvo- (14524) външен >(4268) Informatika- (17799) Iskusstvo- (1338) историята е (13644) Компютри- (11,121) Kosmetika- (55) Kulinariya- (373) културата е (8427) Lingvistika- (374) Literatura- (1642) маркетинг-(23702) математиците на (16968) Механична инженерно (1700) медицина-(12668) Management- (24684) Mehanika- (15423) Naukovedenie- (506) образователна (11852) truda- сигурност (3308) Pedagogika- (5571) Poligrafiya- (1312) Politika- (7869) Лево- (5454) Priborostroenie- (1369) Programmirovanie- (2801) производствено (97 182 ) индустрия- (8706) Psihologiya- (18388) Religiya- (3217) Svyaz (10668) Agriculture- (299) Sotsiologiya- (6455) на (42831) спортист строително (4793) Torgovlya- (5050) транспорт ( 2929) Turizm- (1568) физик (3942) Filosofiya- (17015) Finansy- (26596) химия (22929) Ekologiya- (12095) Ekonomika- (9961) Electronics- (8441) Elektrotehnika- (4623) Мощност инженерно ( 12629) Yurisprudentsiya- (1492) ядрена technics- (1748)

система за разпознаване на глас

Изследване на разпознаване на реч са били държани в продължение на повече от 50 години. В някои натиснете доклади предполагат, че такива изследвания са довели до създаването на системи за търговски разпознаване на реч. Като цяло доверието в наличието на такива средства е подкрепена от появата на нов софтуер на ниска цена, ви позволява да въведете гласова команда и информация в компютъра, без да използвате клавиатурата. Това признаване може да се използва в банките да обслужват клиенти на банката, центрове за услуги, подкрепа фирми, търговски центрове, модели и информационни услуги, резервация системи (билет) резерва, държавни и общински услуги, кол-центрове.

"Проучване на проблема с използването на системи за разпознаване на реч за разузнавателни цели (http://www.agentura.ru/equipment/radio/sys/) не е довело до откриването на доказателства за използването на които сега е система за разпознаване на глас информация по ключова дума или присъствие уточнени всички системи с достатъчна надеждност за целите на разпознаване на реч. Това означава, че проблемът за разпознаване на реч остава далеч не е решен. "

Всички системи за разпознаване на реч, разработени до момента могат да бъдат разделени на два класа: (1) система на едно ниво, разпознаващи речеви събития, използващи или иначе модифицирани правила Бейс (включително невронни мрежи изпълнени); и (2) структурна система за обработка, включително с помощта на емпирични езикови правила.

В момента, в рамките на системата за признаване на речта се разбира, [121] хардуер и системен софтуер, който решава един от следните задачи.

· Признаване на изолирани словесни команди нададе ограничен речников запас. Такива системи се използват за контрол на оборудването, или за въвеждане на данни в предварително определен формат. В този случай, изречените думи с различни паузи между тях.

· Признаване на продължително говорене. В първия случай, операторът - потребител на системата - трябва да се помни лексика система и ограниченията, наложени от стила на изказването, в случай на непрекъснато речник за разпознаване на реч е трябвало да бъде достатъчно голям, че потребителят не трябва да се притеснявате за избора на правилната дума. Потребителят също така не трябва да бъдат разделени в произношението на думата: той може да говори по естествен начин. Такива системи се наричат ​​също така и за диктовка системи или системи, като "реч-текст." Това, например, система за диктовка текстове «Dragon Naturally Speaking», Dragon Inc. компания [110], и «Виа Глас», IBM дружество [96]. Тези речници могат да включват десетки хиляди думи.



· Speech разбирателство. В този случай, потребителят може да прави грешки в произношението, но контекста на дискурса отчита семантиката на съобщението, което е основната цел на системата. Такива системи, в допълнение към човека, не съществува в природата.

Всички тези видове системи за разпознаване на реч, могат да имат допълнителни различия. Има няколко.

· Система за разпознаване може да бъде обучен на индивидуалните характеристики на речта на конкретен говорител, потребителят може да се изчисли на произволна потребител и да doobuchatsya за конкретен говорител.

· Системата може да бъде проектирана за строг стил на изказване, и да възприемат еднакво добре леене различни стилове: тихи, шумни, бързи, бавни, по отношение на физическата активност, в шепот.

· Системата може да бъде проектиран да работи в добри акустични условия, и може да работи в шума, а дори и в лицето на интерфериращи ефекти на други говорители.

Всички системи за разпознаване на реч имат подобна структура, но в зависимост от вида и проблемът е решен, имат приоритет развитието на архитектурата на един или повече посоки. Обикновено системата за разпознаване на реч се състои от следните блокове и устройства: микрофон, превръщането на акустичните сигнали единица в цифров вид, намаляване на блок шум, блокира образуването на първоначалното описание, единица на акустична-фонетичен анализ, обработка мощност от по-горните нива: морфологични, лексикални, синтактични, и и т.н.

акустичен сигнал реч след въвеждане му в системата, дигитализиран, изчистени от шум, и нормализира към амплитудата на корелативна информацията е освободен. След това започва сравнение си с фрагментите, образувани на сцената на стандарти за обучение на различни нива. Нещо повече, образувана от долната страна (акустично-фонетично) нивото на хипотеза - веригата на фонемите (или каквито и да било други fonemopodobnyh елементи), на следните нива са в сравнение със стандартите на речници ниво. Например, със стандартите на речника кореновата морфема - на най-ниското ниво, на следващото ниво - с елементи на речникови думи, и т.н. Въздействието на по-високи нива позволява да се спре увеличаването на броя на възможните хипотези. В същото време, в сравнение с речник и етап на сегментиране като признаване на специфичната акустичен фрагмент позволява да го изолира от потока на речта.

Решаване на конкретни проблеми, например, на проблема с признаването на шум, води до специфичен увеличение на устройството за намаляване на шума, например, чрез въвеждане на допълнителен канал от втория микрофон, насочен противоположно на първото, и изваждане на втория сигнал от първия.

В случай на проблем признаване дума за решаване на ограничен речников запас в системата, в допълнение към акустично-фонетично ниво, достатъчно да има само още едно ниво - лексикални, съдържащи образци от думи. В случай на решения за разпознаване на думи голямо количество лексика задачи полезно да имат междинни нива на докладване, които, поради високите нива на кодиране на информацията думи речници ниски нива за намаляване на общия обем на отчитане. Накрая, системата реч разбиране трябва да има ниво, представляващ семантиката, а вероятно и прагматично.

Когато настройвате говорител формира един набор от стандарти в случай на система високоговорители - няколко комплекта: по един за всяка група от високоговорители, които имат сходни характеристики, за да гласуват.

Същите характеристики като е необходимо въвеждане на счетоводна информация канал (за телефонни и радио канали, за разлика от фиксирана слушалки микрофон).

В случай на решаване на прости проблеми на разпознаване, като ограничен речника на команди, статистическите подходи използват най-често едно ниво. При решаването на по-сложни задачи, като например признаването на ключови думи в един поток на продължително говорене изисква участието в рамките на структурния подход на езикова информация на всички нива, от морфологични да прави разбор. Както и екстра-лингвистична информация - семантичен и прагматичен.

По този начин, от сложността на изпълнение на системи за разпознаване на реч, е необходимостта да се интегрират в един куп информация, като различна вътрешна структура [121] и го изисква за обработка на различни алгоритми. В допълнение, конкретните решения на задачи за разпознаване на реч ви позволяват да използвате реч технология в някои приложения, но тези решения не мащаб и, освен това, че е далеч от приключване на нуждите на използване на комуникационните системи човек-машина. Използването на почти всички съществуващи решения задачата за разпознаване на реч се влива в една психологическа бариера, която се състои в това, че от признаването реч системи хората очакват същите възможности за комуникация, както и че при разглеждането на даден човек. Решението на последния проблем включва реконструкция, ако е възможно, цялата обработка и представяне на информация, което е там в човека. Това означава, че в допълнение към интегрирането на езикови и извън езикови източници на различни нива на познание, системата ще се интегрират по обработка на информация подсистеми други форми главно - визуално. Ефективна интеграция на голямо количество разнообразна информация става възможно в случай на решения на три проблеми. На първо място, е необходимо да се използват същите алгоритми за обработка на информация с различна структура. Второ, желателно е да се приложат тези алгоритми с най-ниски разходи, тоест, с използването на специализирана (насочена към тези алгоритми) оборудване, вместо универсален процесор означава. И трето - това е необходимо за изпълнение на асоциативен начин за достъп до информация.

<== Предишна лекция | На следващата лекция ==>
| система с гласово разпознаване

; Дата: 01.11.2014; ; Прегледи: 170; Нарушаването на авторските права? ;


Ние ценим Вашето мнение! Беше ли полезна публикуван материал? Да | не



ТЪРСЕНЕ:


Вижте също:



zdes-stroika.ru - Studopediya (2013 - 2017) на година. Тя не е автор на материали, и дава на студентите с безплатно образование и използва! Най-новото допълнение , Al IP: 66.102.9.26
Page генерирана за: 0.049 сек.