Към момента съществуват доста компютърни програми, способни с променлив успех да четат по устните на човека това, което той говори. По правило точността на разпознаване на тези програми не надвишава 52%, което не е лош показател – даже човек-професионалист може да постигне едва 50-60%. Учени от Оксфордския университет са разработили алгоритъма LipNet, който чете по устните с точност 93,4%, което за момента е ненадминат резултат.
Успехът на програмата се заключава в това, че тя не се опитва да анализира думите отделно една от друга, а възприема изречението изцяло, а след това използва дълбоко машинно обучение, за да разшифрова вербалната последователност. На практика това е невронна мрежа, способна с голяма вероятност да разпознае всяка произнесена от човека дума.
Сферата на приложение на този алгоритъм е много голяма, но преди всичко той може да се превърне в неоценим помощник на хората със слухови проблеми. Разбира се, засега LipNet разпознава само англоезична реч. В бъдеще обаче нищо не пречи системата да бъде обучена и на нов за нея език.