Lorsque vous utilisez reCAPTCHA, vous traduisez vieux documents
Si vous êtes connecté à pratiquement n'importe quoi sur Internet ces jours-ci, alors vous êtes probablement familier avec l'ensemble du programme CAPTCHA.
C'est la seule chose où vous devez prouver que vous n'êtes pas un spammeur en saisissant quelques mots près illisibles dans une boîte:
Eh bien, c'est embarrassant.
En 2009 , Google et quelques autres entreprises avaient un problème. Ils voulaient des années numériser de vieux journaux et de livres, en utilisant un logiciel qui peut «lire» l'impression qu'il est l'analyse, puis la convertir en texte proprement dit. Mais même les ordinateurs les plus avancés ont des problèmes de lecture les scans de mauvaise qualité, parce que le texte était sale ou tordu, ou dans une police qui a été hors d'usage pendant des années.
Donc, ils ont simplement placé ces mots illisibles entre vous et votre porno, et vous avez dit que vous auriez besoin de les traduire avant d'aller plus loin. Robots des spammeurs ne peut pas les lire parce que reCAPTCHA utilise uniquement les mots que les ordinateurs déjà dit qu'ils ne savaient pas lire. Il est aussi brillant qu'il est simpliste. Le programme est appelé reCAPTCHA , et vous avez probablement déjà vu cette semaine, si ce n'est aujourd'hui. Il est actuellement utilisé par Facebook, Ticketmaster, Twitter, 4chan, CNN.com, StumbleUpon, Craigslist, le US National Telecommunications and Information Administration et beaucoup d'autres sites plus petits.
Et le projet est un énorme succès, en réussissant à numériser 20 ans Le journal New York Times quotidienne en seulement quelques mois, en laissant les internautes décoder les morceaux durs. On estime que les sites Web d'afficher 200 000 000 reCAPTCHAs par jour.