Джерело: скріншот з відео Вашингтонського університету.

Вчені створили навушники, які дозволяють чути конкретну людину, подивившись на неї

Науковцям вдалося створити навушники із системою штучного інтелекту, які дозволяють чути конкретну людину в натовпі просто подивившись на неї. Система має назву Target Speech Hearing — вона блокує зайві звуки в навколишньому середовищі та відтворює лише голос зареєстрованого мовця в режимі реального часу, навіть коли слухач рухається в шумних місцях та більше не перетинається з джерелом звуку.

Про це повідомляє Вашингтонський Університет.

У травні команда науковців з університету представила свій винахід на конференції ACM CHI з людських факторів в обчислювальних системах. 

"Зараз ми схильні думати про штучний інтелект як про веб-чат-ботів, які відповідають на запитання, але в цьому проєкті ми розробляємо штучний інтелект, щоб змінити слухове сприйняття будь-кого, хто носить навушники, враховуючи їхні вподобання. З нашими пристроями тепер ви можете чітко чути одного мовця, навіть якщо ви перебуваєте в галасливому середовищі, де розмовляє багато інших людей", — зазначив професор Університету Вісконсіна в Школі комп'ютерних наук та інженерії Пола Г. Аллена Шьям Голлакота.

Для того, щоб скористатися системою, користувач, який має стандартні навушники з мікрофонами, натискає кнопку, спрямовуючи погляд на когось, хто розмовляє. Потім звукові хвилі від голосу людини мають досягти мікрофонів з обох боків гарнітури одночасно. Навушники надсилають цей сигнал на вбудований комп’ютер, де програмне забезпечення команди машинного навчання вивчає вокальні шаблони потрібного оратора. Система закріплюється за голосом мовця та продовжує відтворювати його для слухача, навіть коли він рухається. 

Здатність системи зосереджуватися на зареєстрованому голосі покращується, адже той, хто говорить, постійно надає більше даних для тренування штучного інтелекту. Науковці протестували систему на 21 мовцю. Виявилось, що якість звуку удвічі краща, якщо система працює з зареєстрованим голосом, ніж з незнайомим для ШІ мовцем.

Наразі система може зареєструвати голос лише однієї людини за раз. Також варто наголосити, що вона може зареєструвати потрібний голос лише тоді, коли немає іншого гучного шуму, який лунає з того ж напрямку, що й голос потрібного користувачеві мовця. Також науковці працюють над тим, щоб у майбутньому розширити систему до слухових апаратів.

Нагадаємо, компанія Neuralink, яка належить винахіднику Ілону Маску, вперше вживила нейрочип у людський мозок. Тепер чоловік використовує його для комунікації з людьми у соцмережах. 

Підписуйтеся на нас в Telegram телеграм, щоб дізнаватися важливі та цікаві новини першими

Технології і наука, 02.06.2024 05:17