torsdag 29 november 2012

reCAPTCHA: Något urtråkigt tråkigt blev helt plötsligt kul

Hur många gånger har man inte suttit och svurit över de enormt svårlästa orden i dessa rutor? Ena ordet brukar väl kunna gå att läsa OK men det andra kan ibland vara mer eller mindre hopplöst. Det kallas för reCAPTCHA och är till för att datorer inte skall kunna t.ex. beställa biljetter i mängder och knäcka systemen som är skapade för människor. Ordverifieringen är till för att visa att vi är en människa. Men måste det vara så svårt. Efter att ha sett en föreläsning med en av skaparna bakom systemet, Luis von Ahn så blev det hela så mycket tydligare.

Faktum är att vi genom att försöka tolka orden deltar i ett mycket större projekt som handlar om skanna in böcker digitalt. Däremot så misslyckas OCR-skanningen i rätt många fall vilket innebär att man genom denna metod kan använda människor för att tolka vilket ordet är. Detta innebär att när tillräckligt många tolkat ordet på samma sätt, vilket maskinerna har misslyckats att tolka, så kan vi utgå från att ordet är korrekt tolkat och då blir det ordet tillagt i OCR-programmen så att fler ord kan tolkas. 

Däremot måste man ju kanske fråga sig som en nära kollega till mig nämnde: Om då maskinerna kan tolka så många ord, då kanske de snart uppträda som människor och tolka de ord som bara vi kan tolka just nu. Vem vet? Men i vilket fall, nu blir det hela förståeligt och nu bidrar vi även till olika inskanningsprojekt som ni kan läsa mer om här.

Den som vill se en intressant föreläsning om detta gör det med fördel nedan i en TED Talk: