Дипфейков все больше. Это необязательно плохо

  • 28 мая 2019
Мона Лиза Правообладатель иллюстрации Samsung
Image caption Разработчики объяснили, как им удалось "оживить" Мону Лизу

Дипфейки окружают нас везде, и эта проблема, похоже, скоро усугубится: только недавно инженеры Samsung разработали говорящие головы, сгенерированные из одного изображения: теперь искуственный интеллект может даже вставить слова в уста Моны Лизы - или, если захотите, Александра Пушкина.

Новые алгоритмы, разработанные командой из московского Центра искусственного интеллекта Samsung и Научно-технологического института Сколково, лучше всего работают с рядом изображений, снятых под разными углами, - но они могут быть весьма эффективными и при загрузке всего одной картинки (или картины).

Согласно исследованию россиян Александры Шишеи, Виктора Лемпицкого, Егора Захарова и Егора Буркова, новая модель создания видеоаватаров может не только работать с маленькой исходной базой изображений, но и создавать компьютерные видеоролики за более короткое время.

Создание ультрареалистичной версии себя в виртуальной реальности вызывает у некоторых беспокойство, особенно когда подложные видеоматериалы - те самые дипфейки - могут быть получены с одного снимка.

Система работает, обучаясь по характерным чертам лиц, которыми затем можно манипулировать.

Большую часть изображений для обучения нейросети россияне взяли в общедоступной базе данных VoxCeleb: специалисты использовали более 7 тыс. изображений знаменитостей.

Правообладатель иллюстрации Samsung
Image caption Мэрилин Монро так же легко поддалась "оживлению"

Так они смогли научить нейронную сеть, как преобразовывать характерные черты совершенно разных лиц в реалистично выглядящее видео.

Полученные нейросетью навыки затем могут быть использованы для преобразования фотографий человека, которого ИИ до этого не видел.

Как и в других инструментах создания лиц, на последнем этапе процесса проверяется "идеальная" модель. Любые кадры, которые выглядят слишком неестественными, обрезаются и воспроизводятся снова, оставляя конечное видео во всё лучшем качестве.

Система и другие подобные ей должны улучшаться по мере совершенствования алгоритмов и повышения эффективности моделей обучения, а значит, нам всё труднее будет отличить дипфейки от реальных людей.

Во вред или во благо?

Один из разработчиков системы Виктор Лемпицкий поиздевался над паникой из-за дипфейков у себя в "Фейсбуке".

"План работ большой. Коммунисты просят к выборам оживить Ильича, из Кремля звонили - говорят, у них там кому-то надо срочно посоветоваться с Ганди. Планируются еще нейросетевая сегментация чакр на фото и возвращение блудных супругов путём обработки селфи (с вероятностью 95% должен возвращаться домой один из пяти последних)", - смеётся знаток нейросетей.

Эксперты обращают внимание и на то, что обучение ИИ распознаванию лиц может в конечном счёте оказаться полезным для человечества.

Например, звёздам кино и телевидения никогда не придётся стареть и умирать - искусственный интеллект скоро станет достаточно умным, чтобы создавать полностью реалистичные аватары из нескольких фотографий и в рекордно короткие сроки.

Сколковский механизм, строго говоря, не совсем нов: так, группа учёных из Университета Тель-Авива представила публике схожую с Samsung систему "оживления" портретов ещё в 2017 году.

Правообладатель иллюстрации ChimpFace
Image caption Иногда система распознавания лиц может спасти жизнь шимпанзе

Исследователь Супасорн Суваджанакорн из Университета Вашингтона два года назад поразил общественность своим "фейковым Бараком Обамой", который говорил и выглядел в точности как настоящий.

Для создания реалистичного изображения ученый и его коллеги обработали 14 часов записей публичных выступлений экс-президента США.

Специалист по дипфейкам сказал Би-би-си, что в ближайшие 10 лет опасаться фейковых видеомоделей не стоит, поскольку специалисты легко отличат подложные видео по движениям зубов и языка.

Суваджанакорн, при этом, в будущем предвидит использование подобных технологий для создания онлайн-аватаров умерших людей, по которым скорбят родственники, или представителей прошлых эпох.

И необязательно воссоздавать именно человеческое лицо: например, зоозащитники вместе с экспертом по цифровым инновациям Колином Маккормаком придумали сходным образом работающее приложение ChimpFace, чтобы распознавать лица шимпанзе и препятствовать браконьерскому истреблению этих животных.

Новости по теме