ANTTIK
26.06.2014, 18:15
Всем доброго дня!
Вопрос такой:
На станции некоторые звонки записываются, плюс к этому записываются всякие совещания и встречи. В общем куча аудио информации, которую секретарши потом должны набирать в ручную. И они от этого давно уже не в восторге.
Подскажите, есть какая-нибудь реально работающая программа по переводу голоса в текст?

aMster
26.06.2014, 22:02
А вы хоть раз сами пользовались сервисами типа Сири или голосовой поиск гугла на смартах?
Нет, если вам чисто поржать - то наверное можно поискать, но вообще, секретарша значительно надежнее. У нее адаптивный алгоритм распознавания, и скорее всего лет 20-30 практики, чем ни одна современная программа не может похвастаться.

lexad
27.06.2014, 03:06
А вы хоть раз сами пользовались сервисами типа Сири или голосовой поиск гугла на смартах?
Нет, если вам чисто поржать - то наверное можно поискать, но вообще, секретарша значительно надежнее. У нее адаптивный алгоритм распознавания, и скорее всего лет 20-30 практики, чем ни одна современная программа не может похвастаться.
нормально английский распознает. в этой области много поделок, но в результате все сводиться к гуглю или ньюансу. в РФ можно яндекс через апи дергать.
делается на коленках на раз-два.
но сильный процент смешного перевода в текст причине неаусканмя таких фич в продажу.
да, мат гугль на звездочки меняет

aMster
27.06.2014, 06:29
нормально английский распознает. в этой области много поделок, но в результате все сводиться к гуглю или ньюансу. в РФ можно яндекс через апи дергать.
делается на коленках на раз-два.
но сильный процент смешного перевода в текст причине неаусканмя таких фич в продажу.
да, мат гугль на звездочки меняет

то есть вы думаете что топикстартеру нужно распознавание английского?

да и то, совещения, встречи, телефонные разговоры - это специфический вид распознавания. Меняются выступающие, фразы длинные, могут быть путанные... короче пока рано об этом говорить.

vd0venk0
27.06.2014, 09:21
Доброго времени!
Насколько мне известно, хорошо работают в этом направлении продукты от ЦРТ (Центр Речевых Технологий). Можете посмотреть на их сайте - http://www.speechpro.ru/

lexad
27.06.2014, 17:50
то есть вы думаете что топикстартеру нужно распознавание английского?

да и то, совещения, встречи, телефонные разговоры - это специфический вид распознавания. Меняются выступающие, фразы длинные, могут быть путанные... короче пока рано об этом говорить.
В прошлом году на яндекс конференции было смешно, когда про качество распознавания русского можно было говорить с испанцем по английски. За его спиной стоял русский разработчик поправлявший его (тоже на английском).
Суть дискуссии что это все было в книжке Рабинера, да и по большому счету в вестнике ieee 80 лохматого года.
Потоковое распознавание русского, да и с индефикация говорящих это попрежнему фантастика.
у гугля в АПИ флак 16кгц, а тефлеонное качество делает распознавание более трудным.

Яндекс с его ограниченным апи не подходит для таких целей, гугл банит IP, а коммерческий Ньюанс английский

IgorN
27.06.2014, 18:01
А ЦРТ при всём моём уважении к ним, предлагает только usb педаль и специальный софт для оптимизации работы набирателей текстов.

ANTTIK
01.07.2014, 18:35
Доброго дня!
Всем спасибо за ответы. Пойду "порадую" секретаря.