Автоперевод и искусственные голоса – новый проект Би-би-си

  • 18 апреля 2016
  • kомментарии
Media playback is unsupported on your device

Автоматизированный перевод с английского на русский, компьютерная озвучка видеосюжетов, синтетические голоса – все это составные части нового экспериментального проекта, запущенного Русской службой Би-би-си и инновационным подразделением BBC News Labs.

Начиная с 18 апреля на сайте Русской службы Би-би-си можно будет смотреть видеоролики, автоматически переведенные на русский язык и озвученные искусственными голосами.

Я почти уверен в том, что мы - первая медиа-компания в мире, устроившая такой эксперимент. Видеоролики, сделанные живыми журналистами, остаются на сайте в разделе "Видео".

Многие знают, что такое Сири. Все мы, скорее всего, время от времени пользуемся онлайн-переводчиками, типа Google Translate, Bing Translator или Яндекс Переводчик.

У кого-то из нас дома уже может даже стоять Amazon Echo – новый домашний помощник, реагирующий на голос .

Автоматизация касается многих областей человеческой жизни, и новости не остаются в стороне (взять хотя бы недавнее появление ботов, рассылающих новости от имени медиа-организаций).

Одна из моих профессиональных задач на Би-би-си – поиск, анализ и внедрение в журналистский обиход новых технологий, которые повышают эффективность работы редакции, позволяют журналистам меньше времени тратить на скучные задания, способствуют росту аудитории на цифровых платформах – на сайтах, в мессенджерах, в соцсетях.

Идей вокруг масса, пробовать приходится много, но по-настоящему полезных мало.

Этот проект – по автоматизации перевода и озвучки видеосюжетов - мы готовили довольно давно: нужно было "сшить" вместе несколько систем, научить их общаться и понимать друг друга, найти высококачественные синтезированные голоса.

Нам также пришлось убедить редакции в том, что делается это не для того, чтобы рано или поздно избавиться от живых людей и отдать производство новостей роботам (хотя примеров автоматизаци новостей довольно много – Los Angeles Times уже давно разрешила роботам писать про регулярно происходящие в регионе землетрясения).

Видео на Русской службе существует уже 10 лет – помню, что первый сюжет с экраном размером со спичечный коробок мы опубликовали в марте 2006 года.

За 10 лет видео стало по-настоящему неотъемлемым форматом любого онлайн-издания, и, по одному из прогнозов, к 2019 году 80% мирового интернет-трафика будет приходиться именно на видео.

Нам очень интересно узнать, что автоматизация видеопроизводства может добавить к уже существующему разделу Русской службы.

Мы отдаем себе отчет в том, что кому-то новая технология может не понравиться: мы внимательно изучим ваши комментарии (вы можете оставить их здесь).

Конечно, это эксперимент. Безусловно, качество перевода оставляет желать лучшего, и его исправляет живой редактор.

Однозначно, искусственные голоса пока не идеальные, но при этом многие, кто слышит их впервые, удивляются, насколько естественно они звучат. Голосов пока два: зовут их Милена и Юрий, в клипе ниже они рассказывают пару слов о себе

Media playback is unsupported on your device

С декабря первый такой проект мы запустили на сайте новостей Би-би-си на японском языке.

Начав получать письма от аудитории, мы были поражены, что реакция зрителей была исключительно положительной.

"Я и не знал, что такое можно сделать, я как будто в будущее заглянул, я только одно могу сказать – потрясающе", - пишет один посетитель сайта новостей Би-би-си на японском языке.

"Я не говорю на английском и ждал появления такой штуки уже очень давно. Я понимаю, что слушаю компьютерный голос, но понимать его легко, спасибо!" - пишет другой.

"Было бы здорово, если бы вы заодно показывали английский текст в виде субтитров", - просит третий. Работа над субтитрами уже ведется!

Проанализировав данные просмотра автоматических роликов, мы были приятно удивлены и тем, что эти показатели мало чем отличаются от показателей роликов, сделанных журналистами – это касается и частоты захода, и длительности просмотра, и нескольких других показателей.

Мне это говорит о том, что японская публика уже достаточно готова к такому продукту и что синтезированные голоса ее не особенно раздражают. Очень интересно будет посмотреть на показатели клипов на русском языке.

В ближайшие месяцы мы планируем запустить подобный сервис на еще нескольких языках – главным образом, мы преследуем две цели.

Первая – предоставить аудитории Би-би-си на иностранных языках больше видео, чем редакции способны произвести вручную, и вторая – оценить перспективы новых технологий и продолжать искать новые решения, с помощью которых они могут помочь журналистике в будущем.

Новости по теме