Из открытых источников
Команда Google DeepMind совместно с Оксфордским университетом представили систему, которая почти на 35% обошла результат профессионального считывателя по губам, пишет Newscientist.

Новости по теме: Google выпустил мобильное приложение для сканирования распечатанных на бумаге фотографий

По информации издания, обучение системы проводилось на телепрограммах каналов Newsnight, BBC Breakfast and Question Time. Данные включали в себя 5 тыс. часов и 118 тыс. предложений.

По результатам тестирования, система продемонстрировала впечатляющий результат.

Для подтверждения эффективности разработки ее создатели провели сравнительный тест, пригласив в качестве оппонента специалиста в чтении по губам. Для эксперимента искусственный интеллект и профессионал получили случайный набор из 200 видео. Человек сумел без ошибок распознать 12,4% слов, система — 46,8%.

Новости по теме: Google научился распознавать заклинания из книг о Гарри Поттере

Отметим, что за две недели до этого Оксфордский университет представил другую обучающуюся систему — LipNet, которая также превзошла человека в распознавании речи по губам. Однако она использовала словарь из 51 уникального слова, в то время как разработка DeepMind успешно справилась с набором из 17 500 слов.

ai1

Необработанный видеоролик из базы данных

Тот же ролик с субтитрами подобранными системой

Тот же ролик с субтитрами, подобранными системой