Lorsque vous utilisez reCAPTCHA, vous traduisez vieux documents

samedi, janvier 19, 2013

Si vous êtes connecté à pratiquement n'importe quoi sur Internet ces jours-ci, alors vous êtes probablement familier avec l'ensemble du programme CAPTCHA.
C'est la seule chose où vous devez prouver que vous n'êtes pas un spammeur en saisissant quelques mots près illisibles dans une boîte:

Eh bien, c'est embarrassant.

Ce que vous ne pouvez pas savoir, c'est que en l'utilisant, vous avez très probablement contribué à la traduction de milliers de documents anciens.
En 2009 , Google et quelques autres entreprises avaient un problème. Ils voulaient des années numériser de vieux journaux et de livres, en utilisant un logiciel qui peut «lire» l'impression qu'il est l'analyse, puis la convertir en texte proprement dit. Mais même les ordinateurs les plus avancés ont des problèmes de lecture les scans de mauvaise qualité, parce que le texte était sale ou tordu, ou dans une police qui a été hors d'usage pendant des années.

google recaptcha
Nous nous souvenons de la police frottis Smudgy faisait partie avec Windows 3.1.

Donc, ils ont simplement placé ces mots illisibles entre vous et votre porno, et vous avez dit que vous auriez besoin de les traduire avant d'aller plus loin. Robots des spammeurs ne peut pas les lire parce que reCAPTCHA utilise uniquement les mots que les ordinateurs déjà dit qu'ils ne savaient pas lire. Il est aussi brillant qu'il est simpliste. Le programme est appelé reCAPTCHA , et vous avez probablement déjà vu cette semaine, si ce n'est aujourd'hui. Il est actuellement utilisé par Facebook, Ticketmaster, Twitter, 4chan, CNN.com, StumbleUpon, Craigslist, le US National Telecommunications and Information Administration et beaucoup d'autres sites plus petits.

google recaptcha
"Nous allons mettre des lignes à travers eux, aussi. Parce que baiser les myopes."

Et le projet est un énorme succès, en réussissant à numériser 20 ans Le journal New York Times quotidienne en seulement quelques mois, en laissant les internautes décoder les morceaux durs. On estime que les sites Web d'afficher 200 000 000 reCAPTCHAs par jour.

Rechercher dans ce blog

Lorsque vous utilisez reCAPTCHA, vous traduisez vieux documents

Posts les plus consultés de ce blog

Numericable affirme son désir d'acheter SFR

'Ctrl+Alt+Suppr' le raccourci clavier trop souvent ignoré ...

Sélection de 69 sites incontournables