ПРОЕКТУВАННЯ ІНФОРМАЦІЙНОЇ СИСТЕМИ З МОЖЛИВІСТЮ ГОЛОСОВОГО УПРАВЛІННЯ

О. І. Безверхий; Д. О. Александренко; В. Є. Луц

doi:10.32782/2521-6643-2023.2-66.2

О. І. Безверхий https://orcid.org/0000-0002-0834-6335
Д. О. Александренко https://orcid.org/0009-0009-1722-2869
В. Є. Луц https://orcid.org/0009-0001-2948-6935

DOI: https://doi.org/10.32782/2521-6643-2023.2-66.2

Ключові слова: голосове управління, фонема, голосовий апарат, штучні нейронні мережі, генетичний алгоритм, спектральні відліки, кепстральні коефіцієнти

Анотація

Робота присвячена створенню інформаційної системи розпізнавання голосових команд на основі штучних нейронних мереж. З розвитком комп'ютерних систем стає все більш очевидним, що використання систем розпізнавання мови набагато розшириться, якщо стане можливим використання людської мови при роботі безпосередньо з комп’ютером, і зокрема стане можливим управління машиною звичайним голосом в реальному часі, а також введення і виведення інформації у вигляді звичайної людської мови. Одним з перспективних способів організації людино-машинного взаємодії є передача комп’ютерній системі інструкцій користувача в форматі мовних команд. Голосовий інтерфейс є необхідним компонентом, коли мова йде про створення комфортних умов життя для людей з обмеженими можливостями. В роботі визначено підходи до виділення інформативних ознак, що описують мовний сигнал: метод лінійного передбачення та спектральний аналіз, розглянуто структуру нейронної мережі із одним зворотнім зв’язком і встановлено, що навчання нейронної мережі здійснюється шляхом послідовного пред’явлення навчальної вибірки, з одночасним налаштуванням ваг відповідно до певної процедури, поки помилка налаштування по всій множині не досягне прийнятного низького рівня. Цінність одержаних результатів полягає в вдосконаленні нового методу розпізнавання мовлення, який краще адаптується до мовлення користувача, що потребує мінімум ресурсів і створенні інформаційної системи з можливістю голосового управління за допомогою пристроїв на базі різних операційних систем. На основі такого підходу спроектовано інформаційний кросплатформенний додаток з голосовим інтерфейсом.

Посилання

1. Dong Yu, Li Deng. Automatic Speech Recognition: A Deep Learning Approach. – L.: Springer-Verlag London, 2015. 320 p.
2. Automatic Speech recognition: short introduction. URL: https://www.esat.kuleuven.be/psi/spraak/demo/Recog/asr_intro.html
3. Автоматичне розпізнавання, розуміння та синтез мовленнєвих сигналів в Україні / Т.К. Вінцюк, М.М. Сажок, Р.А. Селюх, Д.Я. Федорин, О.А. Юхименко, В.В. Робейко. Управляющие системы и машины. 2018. № 6. С. 7–24.
4. Глибовець М. М., Олецький О.В. Штучний інтелект. Київ : «Києво-Могилянська академія», 2002. 364 с.
5. Home Assistant. URL: https://home-assistant.io/
6. Introducing the Web Speech API. URL: https://www.sitepoint.com/introducing-web-speech-api/
7. JavaScript: Web API читання тексту та розпізнавання голосу. URL: https://archakov.im/post/javascriptweb-api-recognition-and-speech-text.html
8. Understand the Smart Home Skill API. URL: https://developer.amazon.com/docs/smarthome/understandthe-smart-home-skill-api.html#how-the-smart-home-skill-api-works
9. annyang! Tutorial. URL: https://github.com/TalAter/annyang

ПРОЕКТУВАННЯ ІНФОРМАЦІЙНОЇ СИСТЕМИ З МОЖЛИВІСТЮ ГОЛОСОВОГО УПРАВЛІННЯ

Анотація

Посилання

Статті цього автора (авторів), які найбільше читають