]]>
]]>
  • Новости
  • Темы
    • Экономика
    • Здоровье
    • Авто
    • Наука и техника
    • Недвижимость
    • Туризм
    • Спорт
    • Кино
    • Музыка
    • Стиль
  • Спецпроекты
  • Телевидение
  • Знания
    • Энциклопедия
    • Библия
    • Коран
    • История
    • Книги
    • Наука
    • Детям
    • КМ школа
    • Школьный клуб
    • Рефераты
    • Праздники
    • Гороскопы
    • Рецепты
  • Сервисы
    • Погода
    • Курсы валют
    • ТВ-программа
    • Перевод единиц
    • Таблица Менделеева
    • Разница во времени
Ограничение по возрасту 12
KM.RU
Наука и техника
Главная → Наука и техника → Технологии
Версия для печати
  • Новости
  • В России
  • В мире
  • Экономика
  • Наука и техника
    • Наука
    • Технологии
    • История
    • Энциклопедия
    • Игры
  • Недвижимость
  • Авто
  • Туризм
  • Здоровье
  • Спорт
  • Музыка
  • Кино
  • Стиль
  • Телевидение
  • Спецпроекты
  • Книги
  • Telegram-канал

Разработана компьютерная программа, распознающая любой язык

12:54 5.09.2012
, Александр Федоров
Фото с сайта originalbuzz.info
Фото с сайта originalbuzz.info

Новая технология, которая позволяет компьютерам узнавать любой язык, выводит автоматическое распознавание речи на новый уровень

Если компьютеры будут приспособлены к распознаванию речи, то совсем скоро мы сможем подавать команды голосом, а не через клавиатуру. «Разговор» с мобильным телефоном уже никого не удивит. Но это – совсем не то же, что программа глобального распознавания любого языка на вашем ПК.

Технология может также использоваться для поиска файлов или фильмов в архивах в Интернете.

Достижение действительно хорошего распознавания речи является трудной задачей. Разговорный язык сильно отличается от письменного: кроме очевидных индивидуальных особенностей произношения, существует множество акцентов и, безусловно, есть различия в диалектах.

Все звучат одинаково

Благодаря финансированию Центра информационных и коммуникационных технологий под руководством Научно-исследовательского совета Норвегии профессор Торбьорн Свендсен из Норвежского университета науки и техники (NTNU) и его коллеги проводили испытания инновационного подхода к созданию технологии распознавания речи следующего поколения.

Норвежские исследователи доказали, что воспроизведение человеческой речи имеет один и тот же механизм на любом языке. Развиваемая технология будет применима к любому языку.

Ученые основывались на фонетике, т. е. на исследовании звуков человеческой речи. Они также включили в программу речь и «системы» нескольких языков, например, порядок слов в формировании предложений.

Метод, разработанный доктором Свендсеном и его коллегами, включает обучение компьютера способности определять, какие части речевых органов активизируются, основываясь на анализе давления звуковых волн, зарегистрированных микрофоном.

Машина учится узнавать звуки

До сих пор самыми распространенными были два разных подхода к системам распознавания речи. Оба основаны на использовании речевых данных и исходных текстов в обучении компьютера распознаванию определенного языка на основе отдельной базы.

При использовании первого подхода есть группа наблюдателей, которые исследуют слова и звуки и выводят общие правила, из которых создаются цифровые алгоритмы. Например, звонкий или глухой звук зависит от того, как вибрируют голосовые связки во время его воспроизведения.

«Если мы проанализируем маленький речевой сегмент и решим, что определенный произнесенный звук достигает максимума в резонансах 750 и 1200 Гц, тогда этот звук, вероятно, «а». Если максимумы будут располагаться в пределах 350 и 800 МГц, то это, вероятно, будет звук «u», – говорит профессор Свендсен.

Другой подход – обучение компьютера с помощью огромного количества типового материала.

«Первоначально машина думает, что все звуки практически одинаковы. Но в процессе «обучения» звуки дифференцируются в зависимости от диапазона частоты, – объясняет доктор Свендсен. – Этот подход позволяет нам обработать намного больше речевых данных, чем подход с использованием наблюдения. Человек может обработать конечное число данных».

Исследовательская группа разработала подход, который представляет собой что-то среднее между двумя традиционными техниками.

«Мы уверены в статистическом подходе, однако мы также должны рассмотреть паттерны предсказуемости, которые существуют в речи в реальном мире. Исследователи включают релевантную информацию об этом в систему и объединяют управляемое данными изучение и подход, основанный на правилах.

Речевые образцы отличаются из-за различий в физиологии, диалекте, образовании и здоровье людей. Все это влияет на голосовое воспроизведение и структуру предложений. Чтобы машина научилась понимать речь, она должна уметь различать наиболее распространенные вариации нормальной речи и языка.

Идентификация языка за несколько секунд

Следующий шаг для норвежских исследователей – разработать независимый от языка модуль для использования в проектировании конкурентоспособных продуктов распознавания речи.

«Решение позволит сэкономить огромное количество времени и денег. Это – важная технология для людей, которые являются частью малой языковой группы, такой как норвежцы. Есть колеблющееся число языков, на которых говорит всего несколько миллионов человек; для этого нам и нужна новая разработка», – говорит доктор Свендсен.

Технология распознавания языков довольно сильно ограничена в применении; данная разработка полезна только там, где одновременно используется несколько языков. Тестовой версии требуется около 30-60 секунд, чтобы идентифицировать язык. Это может быть полезно в случаях, где, например, человек делает презентацию на одном языке и при этом цитирует автора на другом.

Материалы предоставлены Научно-исследовательским советом Норвегии.

Темы: Высокие технологии в мире, Информационные технологии (IT), Исследования, Компьютерная техника, Наука и технологии, Новые технологии, Технологии и решения
Расскажите об этом:
0

Подписаться на KM.RU в Telegram

Сообщить об ошибке на km.ru_new@mail.ru

Комментарии читателей Оставить комментарий

  1. 11.09.2012, 12:25
    Гость: dlinynos

    В российской журналистике.

    • ответить
    • ветвь обсуждения
  2. 11.09.2012, 05:05
    Гость: Виктор

    Где работающая программа?

    • ответить
    • ветвь обсуждения
]]>
]]>
Выбор читателей
Могут и должны
Почему сделка России и США состоится не сейчас
© KM.RU, Александра Воздвиженская
В России предложили повысить транспортный налог для машин старше 15 лет
В Москве проходит прощание с экс-министром транспорта Романом Старовойтом
]]>
Агрегатор 24СМИ
]]>
Избранное
«Северный Флот», 23 октября, «ГлавКлуб»
«Надвое» Тодоровского: в тисках формата. Рецензия
АЙМСОРИ «Лето» (интернет-сингл)
«Заблуждения великого режиссера: благодаря Станиславу Говорухину в наш обиход прочно вошла фраза о России, которую мы потеряли»
Саша Наконечный отказался плясать под чужую дудку
«Приключения Электроников», 5 декабря, «Мумий Тролль Music Bar»
Ермен Анти спел в Актюбинске о тех, кто живет прошлым
Владимир Селиванов, 19 сентября, «Алиби»
Про моделирование взгляда – со звездным Lashmaker Ксенией Емельяновой
Сергей Черняховский. Что тормозит внутренний туризм?
«Моральный кодекс» доказал, что классика останется вечной
официальный сайт © ООО «КМ онлайн», 1999-2025 О проекте ·Все проекты ·Выходные данные ·Контакты ·Реклама
]]>
]]>
Сетевое издание KM.RU. Свидетельство о регистрации Эл № ФС 77 – 41842.
Мнения авторов опубликованных материалов могут не совпадать с позицией редакции.

Мультипортал KM.RU: актуальные новости, авторские материалы, блоги и комментарии, фото- и видеорепортажи, почта, энциклопедии, погода, доллар, евро, рефераты, телепрограмма, развлечения.

Карта сайта


Подписывайтесь на наш Telegram-канал и будьте в курсе последних событий.


Организации, запрещенные на территории Российской Федерации
Telegram Logo

Используя наш cайт, Вы даете согласие на обработку файлов cookie. Если Вы не хотите, чтобы Ваши данные обрабатывались, необходимо установить специальные настройки в браузере или покинуть сайт.