RC-plan som flyger i 727 km/h
Hej! Hej då! Hej! Hej då! 
49.2°
+
Roger Åberg
0
Spotify större än Bonnier
Största mediabolaget i Sverige 
48.1°
+
Roger Åberg
0
En lite vuxnare chokladkalender
Från Chokladfabriken 
95kg
+
Roger Åberg

Googles AI tittar på TV för att bli bättre på läppläsning

Har nu 46,8 procents träffsäkerhet

Visa inte Webb-artiklar
Webb / Google

Att läsa läppar är svårt, men Googles AI DeepMind blir bara bättre och bättre på läppläsning. Detta tack vare tusentals timmars TV-tittande som den artificiella intelligensen fått titta på. TV-programmen i fråga är till stor del från BBC och tack vare detta TV-tittande kan AI:t sätta rätt ord på munrörelserna med 46,8 procents träffsäkerhet. 46,8 procent kanske inte låter allt för imponerande, men när en professionell läppläsare fick titta på samma klipp som AI:t så hade denna endast rätt 12,4 procent av gångerna.

Tidigare i november visade ett gäng forskare vid Oxford upp ett eget läppläsarprogram vid namn LipNet som kunde tyda korrekt ord 93,4 procent av gångerna genom att bara läsa läppar. LipNet använde sig av förinspelade inslag där skådespelare fått ställa sig framför en kamera och prata där maximalt 51 ord används, medan Googles DeepMind kör mer på maskininlärning. Mer specifikt kallar Google sitt inlärningssystem för "Watch, Listen, Attend, and Spell" där DeepMind fått titta på 5 000 timmar TV-program med 118 000 meningar med 17 500 unika ord.

DeepMind-utvecklarna menar att DeepMinds läppläsning kan användas bland annat för att hjälpa hörselskadade att hänga med i konversationer, lägga till undertexter i filmer eller länkas samman med röstassistenter så att du kan prata med assistenten endast genom att röra munnen.