dimanche 27 mai 2012 Dernière mise à jour 01h01
fermer

Connexion au Devoir.com

Mot de passe oublié?


Chercher

Inscrivez-vous (gratuit)
Mot de passe oublié?
Abonné papier? Connexion
S'abonner au Devoir
Les mutations tranquilles CULTURES + SOCIÉTÉ + PARADOXES

Numériser le patrimoine écrit, un mot à la fois

Fabien Deglise   1 décembre 2011 16h06  Les mutations tranquilles
<br />

Il fallait y penser et c'est fait. reCAPTCHA, un service qui fait sensation depuis quelques temps sur la Toile, propose d'unir le principe de sécurité des tests CAPTCHA — ces caractères un peu flous dans un formulaire en ligne qu'on vous demande de déchiffrer pour confirmer que vous êtes bien un humain — avec la numérisation du patrimoine écrit à une autre époque et que les machines n'arrivent pas toujours très bien à lire. Ça s'appelle l'intelligence collective au service de la mémoire collective. Et c'est assez brillant.

La multinationale américaine Google est derrière tout ça. Dans les grandes lignes, reCAPTCHA vise à tirer profit des tests CAPTCHA, qui se multiplient sur le web pour discriminer les humains des robots envoyés dans le cyberespace pour collecter des informations automatiquement. Comment? En substituant les chaînes de caractères, généralement sans grandes significations, utilisés dans ces tests par des mots issus de documents anciens qui viennent d'être numérisés. C'est qu'en raison parfois d'une encre qui bave sur le papier ou d'une impression vaporeuse, ces mots, une fois numérisés, sont plus facilement reconnus par un oeil humain que par les logiciels de reconnaissance de caractères.

D'ordinaire, les correcteurs et relecteurs d'épreuves numériques doivent «rattraper» ces mots manqués par la modernité et les yeux électroniques. Avec reCAPTCHA, Google propose de mettre cette lourde tâche dans les mains de simples internautes qui, du coup, vont contribuer à la construction du patrimoine numérique sans vraiment s'en rendre compte d'ailleurs.

Actuellement, de très vieilles éditions du New York Times sont en train de se faire corriger de la sorte par des quidams en ligne invités, ici et là, à confirmer qu'ils sont bien faits de chair et d'os en entrant des chaînes de caractères à la main. Des bouquins que Google fait entrer aussi dans sa section «livres» sont également soumis au même traitement.

Et les possibilités de développement de ce service, que Google met à la disposition de tous les propriétaires de sites web gratuitement, sont vastes. C'est le géant de la recherche en ligne qui le dit: chaque jour, près de 200 millions de ces tests CAPTCHA (pour Completely Automated Public Turing test to tell Computers and Humans Apart) sont résolus chaque jour dans un coin du web. Parfois en s'y reprenant à plusieurs reprises parce que la chaîne de caractères est plus que pas claire.

Quand on met bout à bout les secondes drainées par ces tests, cela représenterait pas moins de 150 000 heures de travail chaque jour qui ne servent à rien d'autre qu'au maintien de la sécurité en ligne. reCAPTCHA, dont on peut désormais qu'espérer un déploiement dans la sphère francophone, propose finalement rien de plus que de transférer ces heures aussi dans le champ de la culture. Et c'est déjà beaucoup.

 
 
Édition abonné
La version longue de certains articles (environ 1 article sur 5) est réservée aux abonnés du Devoir. Ils sont signalés par le symbole suivant :
 
 












CAPTCHA Image Générer un nouveau code

Envoyer
Fermer

Haut de la page
Cet article vous intéresse?

Vos réactions

Triez : afficher les commentaires  Chargement ...
  • Marie-Michele Fournier - Abonné
    1 décembre 2011 09 h 18
    Depuis 2007 déjà
    reCaptcha est un projet super intéressant et c'est génial d'en parler, mais il est loin d'être un nouveau service sur la Toile puisqu'il a été mis en ligne dès 2007 comme on peut voir dans cet article: http://news.bbc.co.uk/2/hi/technology/7023627.stm.
    Par contre il est vrai que le déploiement côté francophone se fait encore attendre.
  • fermer
    Vous devez être connecté pour rédiger un commentaire.
    ou Créer un profil
  •  
  • Jacques Anar - Inscrit
    2 décembre 2011 10 h 22
    Merci!
    Je ne savais pas à quel point ces petits tests prenaient de temps collectivement. Utiliser ce temps pour en faire quelque chose, c'est une merveilleuse idée.

    J'aurais aimé lire l'article référé par Marie-Michelle Fournier mais le lien ne fonctionne plus. (Erreur 404.)

    Bonne journée!
  • fermer
    Vous devez être connecté pour rédiger un commentaire.
    ou Créer un profil
  •  
  • Minotaur - Inscrit
    2 décembre 2011 18 h 13
    Rien de nouveau et pourtant
    J'ai toujours une déception de voir que l'univers francophone est en retard. De voir que ce n'est que maintenant que ce genre de nouvelle fait les manchettes ici. 4-5 ans c'est une éternité en informatique... facebook était microscopique.

    Mais de là à dire que c'est pourquoi certain préfère l'anglais en éducation ou en profession il y a un pas qu'on ne doit pas franchir ici...
  • fermer
    Vous devez être connecté pour rédiger un commentaire.
    ou Créer un profil
  •  
  • Marie-Michele Fournier - Abonné
    5 décembre 2011 10 h 06
    Au sujet du lien
    Désolée pour le lien brisé, c'est parce que j,ai mis le point trop proche. le revoici:
    http://news.bbc.co.uk/2/hi/technology/7023627.stm
  • fermer
    Vous devez être connecté pour rédiger un commentaire.
    ou Créer un profil
  •  
  • fermer
    Vous devez être connecté pour rédiger un commentaire.
    ou Créer un profil
Cet article vous intéresse?
4 réactions
5 votes Voter
 
  • a Taille du texte -- ++
  • Imprimer
  • Envoyer
  • Partager
  • Voter
Mots-clés de l'article
Recherche complète sur le même sujet


Les blogues du devoir

Publicité


Vos commentaires

m'inscrire
 
Recherche



Exemples de recherche :
Robert Sansfaçon
"directeur général des élections"

S'abonner au Devoir
Abonnez-vous au journal papier Le Devoir ou à la version Internet.
Publicité
Vous souhaitez annoncer dans Le Devoir, contactez le service de publicité.

En savoir plus
Stratégie Web et référencement par Adviso
Design Web par Egzakt
© Le Devoir 2002-2012