]]>
]]>
  • Новости
  • Темы
    • Экономика
    • Здоровье
    • Авто
    • Наука и техника
    • Недвижимость
    • Туризм
    • Спорт
    • Кино
    • Музыка
    • Стиль
  • Спецпроекты
  • Телевидение
  • Знания
    • Энциклопедия
    • Библия
    • Коран
    • История
    • Книги
    • Наука
    • Детям
    • КМ школа
    • Школьный клуб
    • Рефераты
    • Праздники
    • Гороскопы
    • Рецепты
  • Сервисы
    • Погода
    • Курсы валют
    • ТВ-программа
    • Перевод единиц
    • Таблица Менделеева
    • Разница во времени
Ограничение по возрасту 12
KM.RU
Наука и техника
Главная → Наука и техника → Технологии
Версия для печати
  • Новости
  • В России
  • В мире
  • Экономика
  • Наука и техника
    • Наука
    • Технологии
    • История
    • Энциклопедия
    • Игры
  • Недвижимость
  • Авто
  • Туризм
  • Здоровье
  • Спорт
  • Музыка
  • Кино
  • Стиль
  • Телевидение
  • Спецпроекты
  • Книги
  • Telegram-канал

Разработана компьютерная программа, распознающая любой язык

12:54 5.09.2012
, Александр Федоров
Фото с сайта originalbuzz.info
Фото с сайта originalbuzz.info

Новая технология, которая позволяет компьютерам узнавать любой язык, выводит автоматическое распознавание речи на новый уровень

Если компьютеры будут приспособлены к распознаванию речи, то совсем скоро мы сможем подавать команды голосом, а не через клавиатуру. «Разговор» с мобильным телефоном уже никого не удивит. Но это – совсем не то же, что программа глобального распознавания любого языка на вашем ПК.

Технология может также использоваться для поиска файлов или фильмов в архивах в Интернете.

Достижение действительно хорошего распознавания речи является трудной задачей. Разговорный язык сильно отличается от письменного: кроме очевидных индивидуальных особенностей произношения, существует множество акцентов и, безусловно, есть различия в диалектах.

Все звучат одинаково

Благодаря финансированию Центра информационных и коммуникационных технологий под руководством Научно-исследовательского совета Норвегии профессор Торбьорн Свендсен из Норвежского университета науки и техники (NTNU) и его коллеги проводили испытания инновационного подхода к созданию технологии распознавания речи следующего поколения.

Норвежские исследователи доказали, что воспроизведение человеческой речи имеет один и тот же механизм на любом языке. Развиваемая технология будет применима к любому языку.

Ученые основывались на фонетике, т. е. на исследовании звуков человеческой речи. Они также включили в программу речь и «системы» нескольких языков, например, порядок слов в формировании предложений.

Метод, разработанный доктором Свендсеном и его коллегами, включает обучение компьютера способности определять, какие части речевых органов активизируются, основываясь на анализе давления звуковых волн, зарегистрированных микрофоном.

Машина учится узнавать звуки

До сих пор самыми распространенными были два разных подхода к системам распознавания речи. Оба основаны на использовании речевых данных и исходных текстов в обучении компьютера распознаванию определенного языка на основе отдельной базы.

При использовании первого подхода есть группа наблюдателей, которые исследуют слова и звуки и выводят общие правила, из которых создаются цифровые алгоритмы. Например, звонкий или глухой звук зависит от того, как вибрируют голосовые связки во время его воспроизведения.

«Если мы проанализируем маленький речевой сегмент и решим, что определенный произнесенный звук достигает максимума в резонансах 750 и 1200 Гц, тогда этот звук, вероятно, «а». Если максимумы будут располагаться в пределах 350 и 800 МГц, то это, вероятно, будет звук «u», – говорит профессор Свендсен.

Другой подход – обучение компьютера с помощью огромного количества типового материала.

«Первоначально машина думает, что все звуки практически одинаковы. Но в процессе «обучения» звуки дифференцируются в зависимости от диапазона частоты, – объясняет доктор Свендсен. – Этот подход позволяет нам обработать намного больше речевых данных, чем подход с использованием наблюдения. Человек может обработать конечное число данных».

Исследовательская группа разработала подход, который представляет собой что-то среднее между двумя традиционными техниками.

«Мы уверены в статистическом подходе, однако мы также должны рассмотреть паттерны предсказуемости, которые существуют в речи в реальном мире. Исследователи включают релевантную информацию об этом в систему и объединяют управляемое данными изучение и подход, основанный на правилах.

Речевые образцы отличаются из-за различий в физиологии, диалекте, образовании и здоровье людей. Все это влияет на голосовое воспроизведение и структуру предложений. Чтобы машина научилась понимать речь, она должна уметь различать наиболее распространенные вариации нормальной речи и языка.

Идентификация языка за несколько секунд

Следующий шаг для норвежских исследователей – разработать независимый от языка модуль для использования в проектировании конкурентоспособных продуктов распознавания речи.

«Решение позволит сэкономить огромное количество времени и денег. Это – важная технология для людей, которые являются частью малой языковой группы, такой как норвежцы. Есть колеблющееся число языков, на которых говорит всего несколько миллионов человек; для этого нам и нужна новая разработка», – говорит доктор Свендсен.

Технология распознавания языков довольно сильно ограничена в применении; данная разработка полезна только там, где одновременно используется несколько языков. Тестовой версии требуется около 30-60 секунд, чтобы идентифицировать язык. Это может быть полезно в случаях, где, например, человек делает презентацию на одном языке и при этом цитирует автора на другом.

Материалы предоставлены Научно-исследовательским советом Норвегии.

Темы: Высокие технологии в мире, Информационные технологии (IT), Исследования, Компьютерная техника, Наука и технологии, Новые технологии, Технологии и решения
Расскажите об этом:
0

Подписаться на KM.RU в Telegram

Сообщить об ошибке на km.ru_new@mail.ru

Комментарии читателей Оставить комментарий

  1. 11.09.2012, 12:25
    Гость: dlinynos

    В российской журналистике.

    • ответить
    • ветвь обсуждения
  2. 11.09.2012, 05:05
    Гость: Виктор

    Где работающая программа?

    • ответить
    • ветвь обсуждения
]]>
]]>
Выбор читателей
Баку выразил протест в связи с задержанием азербайджанцев в Екатеринбурге
Пенсионеры © KM.RU, Илья Шабардин
У инфляции в России нашли виновных, ими оказались пенсионеры
МИД Армении призвал Россию не вмешиваться в дела страны
Состояние богатейших россиян за полгода выросло на 24,5 млрд долларов
]]>
Агрегатор 24СМИ
]]>
]]>
]]>
Избранное
«Кирпичи», 23 июня, «16 Тонн»
Россиян ожидает очередное повышение тарифов ЖКХ?
Российские ЧВК в Мали
«Президентские выборы в Белоруссии продемонстрировали нечто запредельное – голосование при введенных в столицу армейских частях»
Kiri No Mori «Изанаги» (сетевой EP)
Экологические аспекты транспортных сервисов: влияние на рынок такси
II Московский джазовый фестиваль, 19-25 июня, Разные площадки Москвы
«Ухудшились условия для размещения средств за границей, приходится рассматривать варианты инвестирования внутри страны»
Завершился первый этап работ по комплексной модернизации магистралей БАМа
Vere Dictum «Тетрадь смерти» (Acoustic Version)
Вадим Курылев «Идя через лес» (трибьют Кириллу Комарову)
официальный сайт © ООО «КМ онлайн», 1999-2025 О проекте ·Все проекты ·Выходные данные ·Контакты ·Реклама
]]>
]]>
Сетевое издание KM.RU. Свидетельство о регистрации Эл № ФС 77 – 41842.
Мнения авторов опубликованных материалов могут не совпадать с позицией редакции.

Мультипортал KM.RU: актуальные новости, авторские материалы, блоги и комментарии, фото- и видеорепортажи, почта, энциклопедии, погода, доллар, евро, рефераты, телепрограмма, развлечения.

Карта сайта


Подписывайтесь на наш Telegram-канал и будьте в курсе последних событий.


Организации, запрещенные на территории Российской Федерации
Telegram Logo

Используя наш cайт, Вы даете согласие на обработку файлов cookie. Если Вы не хотите, чтобы Ваши данные обрабатывались, необходимо установить специальные настройки в браузере или покинуть сайт.