Technologie: Indiscret Google

Réduire le texte Agrandir le texte Envoyer cet article Imprimer cet article Fil RSS Droits de reproduction

Michel Dumais
Édition du lundi 17 février 2003

Mots clés : google

Indiscret le moteur de recherche Google? Tu parles Paul! Non seulement ce coquin indexe tout ce qu'il trouve sur son chemin, mais il trouve le moyen de garder le tout pour lui. Et pour lui faire effacer de ses bases de données des renseignements qui n'auraient pas dû se trouver sur son chemin, c'est basta... à moins d'avoir les bons avocats.

Qui ne connaît pas Google? Qui dit recherche sur la Toile pense automatiquement Google. Nos voisins du Sud, qui ont le chic pour déclencher une guerre ou inventer de nouveaux néologismes, ont trouvé ceux-ci, «to google» ou encore «googling a person», pour décrire une recherche effectuée pour en savoir un peu plus sur une personne.

Connu le moteur de recherche? Plus que vous ne le croyez. En effet, selon un petit sondage réalisé sur Internet par une firme britannique, InterBrand, auprès de 1 315 personnes réparties dans 72 pays, la marque de commerce Google dépasserait en terme de reconnaissance des marques établies comme Apple et Coke. Mais certaines fonctionnalités de Google ont de quoi nous faire réfléchir.

Le saviez-vous? Depuis toujours, lorsque vous accédez au site de Google, celui-ci vous glisse subrepticement un fichier témoin (cookie) dont la date de péremption est l'an 2038. Autant mieux dire que ce fichier est immortel ou presque. Chaque fois que vous accédez à la page d'accueil de Google, celui-ci vérifie ce fichier témoin, fichier qui vous identifie à l'aide d'un numéro d'identification unique.

De plus, pour chaque recherche que vous effectuez sur Google, on recueille, sans vous le demander évidemment, votre numéro d'identification, votre adresse IP, adresse qui donne «l'identité» de votre ordinateur, la date et l'heure de votre visite, ainsi que le sujet de votre recherche. Et de plus en plus, Google personnalise ses résultats de recherche en se basant sur votre adresse IP, donc votre provenance.

Évidemment, nul moyen de savoir pourquoi ces informations personnelles sont conservées dans les bases de données de Google. Dans une entrevue livrée au New York Times, un représentant de Google n'a pu dire si Google pouvait livrer ces informations à la demande, par voie judicaire, d'une administration quelconque.

Abus possibles

Ce qui pourrait, en ces temps de paranoïa, ouvrir la porte à bien des abus, vous en conviendrez. Imaginez un sympathique camarade de la trempe de John Poindexter demander à Google de lui livrer tous ceux qui ont fait des recherches sur Google en utilisant certains mots clés. Quelqu'un a dit Big Brother?

Vous vous en souviendrez sûrement, nous avions été les premiers, avec l'aide du spécialiste en référencement Éric Baillargeon, à révéler les indiscrétions de Google alors que de nouvelles fonctionnalités permettaient au moteur de recherches d'indexer non seulement les pages HTML, mais aussi des documents de toutes sortes, comme les fichiers provenant de nombreux texteurs, des feuilles de calcul Excel, des bases de données Access et Dbase et j'en passe. Gare à vous si vous laissez traîner par inadvertance des fichiers confidentiels sur un de vos serveurs reliés à la Toile. Google lit tout, et conserve tout.

Conserve tout? Tout à fait, Google conserve indéfiniment toutes les informations qu'il croise sur son chemin. Et quant à lui faire retirer quelque chose de ses banques de données, armez-vous de patience... et quelquefois de bons avocats.

De plus, la mémoire tampon (cache) de Google lui permet de conserver certaines informations qui ont été effacées de certains sites. Par exemple, à la suite de notre article l'année dernière, peu de temps après, nous avons vu de nombreux sites militaires effacer des documents croquignolets, et indiscrets, qui avaient été oubliés sur leurs serveurs. Toutefois, grâce à la mémoire tampon, il était encore possible de les consulter. La seule façon d'empêcher Google de tout conserver dans sa mémoire tampon est d'indiquer dans toutes les pages Web d'un site l'instruction NOARCHIVE.

Mais il arrive que les bons avocats aillent un peu trop loin, et que Google agrée un peu trop facilement leurs exigences.

Comme lorsque les avocats de l'Église de scientologie ont demandé à Google de retirer de leurs bases de données, toute référence à un site Internet, Xenu.net, sous prétexte que ce site était en contradiction avec certaines lois concernant les marques de commerce et le droit d'auteur. Google a alors effacé TOUTES les références à Xenu.net. Heureusement, des protestations venant de toutes parts ont fait changer d'idée les dirigeants de Google.

Pour vous donner une idée de la puissance de rétention des informations de Google, il arrive maintenant que de nombreux employeurs fassent une première enquête sur votre humble personne en faisant une recherche avec votre nom et votre prénom. De nombreuses personnes se sont fait ainsi refuser des postes à cause de certaines informations révélées par l'indiscret moteur de recherche. Une page personnelle un peu trop impertinente ou critique? Des propos laissés dans un forum de discussion? Google lit tout, et garde tout en mémoire, tout en étant prêt à livrer ces informations à qui inscrit la bonne requête.

On fait quoi

Alors, on fait quoi me direz-vous? Il est vrai que Google est aujourd'hui, un incontournable. Mais il existe certains trucs pour empêcher Google de tout savoir sur notre personne, par adresse IP interposée. Primo, débarrassez-vous de tout fichier témoin, et configurez votre fureteur pour que celui-ci refuse tous ceux que l'on voudra vous envoyer. Deuxio: au lieu d'interroger directement Google, utilisez des services de navigation anonyme comme Anonymizer qui permettent de batifoler sur la Toile sans laisser de traces. Tertio, certains pages comme celle-ci de Google-Watch permettent d'interroger Google, par l'intermédiaire d'un serveur Proxy.

mdumais@ledevoir.com


Réduire le texte Agrandir le texte Envoyer cet article Imprimer cet article Fil RSS Droits de reproduction

Haut de la page

Vous avez le statut de visiteur
Identifiez-vous


[an error occurred while processing this directive]

Recherchez dans le site

Recherche rapide dans Le Devoir.com