В России создан первый аудиопоисковик

Ноябрь 2024
Пн	Вт	Ср	Чт	Пт	Сб	Вс
« Апрель
	1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30

Ξ 18 февраля, 2008 | → | ∇ Новости отовсюду |

Москва, Февраль 15 (Новый Регион, Алексей Усов) – Как сообщает информационный портал Bybanner, «Центр речевых технологий» объявил об окончании работ над технологией Voice Digger – поиском «ключевых» слов в фонограммах русской речи. Это первая в России коммерческая разработка в области audio data mining – одного из самых перспективных направлений цифрового компьютерного рынка в мире.

Разработанный «Центром речевых технологий» Voice Digger – первый отечественный поиск по ключевым словам в звукозаписях русской речи. Voice Digger позволяет автоматически выделять ключевые слова и словосочетания в потоке слитной речи без предварительного прослушивания. Разработка основана на непрерывном распознавании речи, реализуемом с использованием теории скрытых марковских процессов (НММ). Ключевые слова задаются в виде обычного текста, по которому система строит НММ-модель каждого слова. На выходе VoiceDigger предоставляет ссылку на звуковой документ и местоположение искомого слова или словосочетания.

Качество системы поиска ключевых слов определяется двумя показателями: вероятности обнаружения ключевого слова и вероятности ложного срабатывания при заданной длине искомого слова. Уровень ошибки системы составляет порядка 8%.

В ЦРТ считают, что новая технология будет пользоваться спросом в крупных системах обработки, хранения и анализа данных. Модули, созданные на базе Voice Digger, позволят оперативно обработать не только текстовые, но и мультимедиа-данные и получить на выходе систематизированные выборки по интересующей пользователя тематике.

www.nr2.ru

Еще статьи:

АртНавигатор

Всего 12,843 публикаций. Вы можете просмотреть архив.

Архив

Реклама