Корпорация Microsoft работает над технологией, которая позволяет распознавать речь, переводить ее на другой язык и воспроизводить ее на новом языке с сохранением особенностей голоса говорящего. Об этом написал в корпоративном блоге директор Microsoft по разработкам Рик Рашид, пишут РИА Новости.
Microsoft представила технологию перевода речи с сохранением особенностей голоса
Рашид впервые продемонстрировал работу технологии, выступая на презентации в Китае. Сперва его речь на мероприятии распознавалась в реальном времени и выводилась на экран в виде обновляемого текста на английском языке.
Далее он показал, что новая программная технология Microsoft позволяет переводить содержание этой речи на китайский язык с учетом его лексических и грамматических особенностей — при этом перевод шел также в реальном времени.
Наконец, финальным этапом стал голосовой перевод его речи — Рашид произносил предложение на английском языке, а программа воспроизводила его на китайском языке с сохранением особенностей голоса топ-менеджера Microsoft.
«Наиболее значительным является то, что мы добились важной цели — смогли позволить англоговорящему человеку, подобному мне, провести презентацию на китайском, сохраняя свой голос», — отмечает в блоге Рашид.
По словам Рашида, компания Microsoft ведет разработки в этой области совместно с университетом Торонто около двух лет. В то же время, несмотря на достигнутые успехи, технология по-прежнему делает ошибки в одном слове из 7-8.
«Результаты по-прежнему не идеальны, и предстоит серьезная работа в этой области, однако технология является весьма многообещающей. Мы надеемся, что через несколько лет у нас будут системы, которые смогут полностью разрушить языковые барьеры», — подчеркнул он.
Когда технология распознавания и перевода речи с сохранением голоса поступит в коммерческое использование, и поступит ли вообще, топ-менеджер Microsoft не уточнил.
Коментарі