banner banner banner

Искусственный интеллект Google читает по губам на 35% лучше человека

Человек сумел без ошибок распознать 12,4% слов, система — 46,8%

Из открытых источников

Команда Google DeepMind совместно с Оксфордским университетом представили систему, которая почти на 35% обошла результат профессионального считывателя по губам, пишет Newscientist.

Новости по теме: Google выпустил мобильное приложение для сканирования распечатанных на бумаге фотографий

По информации издания, обучение системы проводилось на телепрограммах каналов Newsnight, BBC Breakfast and Question Time. Данные включали в себя 5 тыс. часов и 118 тыс. предложений.

По результатам тестирования, система продемонстрировала впечатляющий результат.

Для подтверждения эффективности разработки ее создатели провели сравнительный тест, пригласив в качестве оппонента специалиста в чтении по губам. Для эксперимента искусственный интеллект и профессионал получили случайный набор из 200 видео. Человек сумел без ошибок распознать 12,4% слов, система — 46,8%.

Новости по теме: Google научился распознавать заклинания из книг о Гарри Поттере

Отметим, что за две недели до этого Оксфордский университет представил другую обучающуюся систему — LipNet, которая также превзошла человека в распознавании речи по губам. Однако она использовала словарь из 51 уникального слова, в то время как разработка DeepMind успешно справилась с набором из 17 500 слов.

ai1

Необработанный видеоролик из базы данных

Тот же ролик с субтитрами подобранными системой

Тот же ролик с субтитрами, подобранными системой

Источник: 112.ua

видео по теме

Loading...


Новости по теме

Виджет партнеров

d="M296.296,512H200.36V256h-64v-88.225l64-0.029l-0.104-51.976C200.256,43.794,219.773,0,304.556,0h70.588v88.242h-44.115 c-33.016,0-34.604,12.328-34.604,35.342l-0.131,44.162h79.346l-9.354,88.225L296.36,256L296.296,512z"/>