Heureux le samedi, malheureux le mardi
Une étude de l'Université Harvard réalisée à partir de 300 millions de tweets dresse l'indice de bonheur des Américains, sept jours sur sept, 24 heures par jour
Photo : Agence Reuters
La carte des États-Unis et l’humeur de ses habitants, région par région, d’heure en heure. ATTENTION: la carte est bonne, mais la légende «heureux/maheureux» au bas de la carte est erronée, à cause d'une erreur technique. Il faut bien lire ceci: rouge c'est malheureux, et vert c'est heureux. Nos excuses.
Le microbillet, ou tweet, en dit long sur l'humeur des Américains, même s'il ne fait que 140 caractères. La Californie voit rose plus souvent que New York, nous apprend-il, et à trois heures de la nuit, c'est le centre du pays qui a les boules. L'analyse des microtextes a également révélé une toute nouvelle façon de sonder la population.
Des chercheurs en informatique de l'Université Harvard et de la Northeastern University ont étudié les courts textes publiés sur le site de microblogues Twitter pour «saisir le pouls de la nation». «On voulait comprendre quel type d'informations se retrouvent sur Twitter, qui est accusé d'être très superficiel, explique l'un des chercheurs, Sune Lehmann, depuis son bureau de Boston. C'est pourtant faux, Twitter est très riche en informations et sa structure est très complexe.»
En effet, on apprend beaucoup à consulter le cartogramme que les chercheurs ont produit grâce à 300 millions de microbillets publiés entre 2006 et 2009. D'abord, les snowbirds québécois ont bien choisi leur destination hivernale, car l'humeur y est la meilleure au pays. On apprend aussi qu'entre 14h et 16h, c'est l'heure critique. Tous les États émettent surtout des tweets à caractère négatif. La côte ouest est en général plus heureuse que la côte est. Et évidemment, tout le monde utilise plus joyeusement le clavier d'ordinateur le samedi, tandis que c'est le mardi qui connaît le pire creux de la semaine.
Données scientifiques?
Les auteurs en sont conscients: les «twitteux» ne constituent pas une population représentative des Américains. Un autre biais est dû au fait que ce soit un ordinateur qui évalue les tweets sur l'échelle de la joie, plutôt que de vrais cerveaux. On ne peut ainsi jamais être certain du bon classement des microtextes, puisque le sarcasme n'est pas décodé, tout comme les expressions. D'autant plus que le lexique des Américains diffère d'une région du pays à une autre.
Néanmoins, cet exercice «a permis de constater le potentiel de Twitter, croit Sune Lehmann. Un tweet ne veut rien dire, mais des millions, c'est beaucoup d'information. Si on croise ces informations avec des sondages traditionnels ou avec les données météorologiques, qui influencent certainement l'humeur, ça peut devenir très intéressant». Et c'est justement la prochaine étape que franchira le groupe de chercheurs.
On est toutefois très loin du jour où Twitter sera une option à la question du formulaire long au recensement, à en écouter Madeleine Pastinelli, professeure spécialisée en communication électronique à l'Université Laval et auteure de Des souris, des hommes, des femmes et une ethnologue au village global: parole, pratiques identitaires et lien social dans un espace de bavardage électronique estime qu'on est loin de pouvoir récolter des données qui soient utiles pour l'instant. «Je trouve extrêmement dangereuse l'illusion de sérieux de ce genre de démarche. Le nombre [de microbillets analysés] donne une impression de rigueur. Ça pourrait faire en sorte que des subventionnaires jugent cette démarche plus pertinente.»
Sune Lehmann spécule et réplique que l'abondance de données donne tout de même un «signal», puisque les données trompeuses ne sont probablement pas majoritaires et se perdent dans le flot de «bonnes» données. Mais reste la question du sens, que l'ordinateur peinera peut-être à trouver: l'analyse de ces millions de mots ne réussit pas à nous dire pourquoi les Américains souffrent au travail entre 14h et 16h!
Twitter les tendances
Le contenu des tweets n'est tout de même pas sans valeur. Après tout, les internautes y jasent de ce qui les intéresse ou les touche. Par sa forme restreinte à un nombre maximal de caractères, ils vont peut-être même à l'essentiel.
Le coloré chroniqueur à la Revanche des nerdz Pascal Forget est de ceux qui croient que Twitter est bien plus que du bruit, bien plus que des mots vides. «Les réseaux sociaux sont des baromètres d'intérêt formidables. Le prochain artiste populaire? Le succès d'un produit, d'un film? On peut le voir avec Twitter et les réseaux sociaux. J'imagine qu'on pourrait même mieux prédire le cours de la Bourse qu'avec les méthodes actuelles!» blague-t-il.
Si l'analyse des messages publiés sur les réseaux sociaux en est encore à ses balbutiements dans la communauté scientifique, les entreprises en quête de données sur le marché risquent de les trouver fort intéressantes. «Les outils d'analyse de la "statusphere" vont exploser dans les prochaines années pour nous aider à mieux comprendre, mieux analyser ces données», prédit Sébastien Provencher, le cofondateur de Praized média, une jeune boîte qui développe des logiciels pour les médias sociaux.
Des chercheurs en informatique de l'Université Harvard et de la Northeastern University ont étudié les courts textes publiés sur le site de microblogues Twitter pour «saisir le pouls de la nation». «On voulait comprendre quel type d'informations se retrouvent sur Twitter, qui est accusé d'être très superficiel, explique l'un des chercheurs, Sune Lehmann, depuis son bureau de Boston. C'est pourtant faux, Twitter est très riche en informations et sa structure est très complexe.»
En effet, on apprend beaucoup à consulter le cartogramme que les chercheurs ont produit grâce à 300 millions de microbillets publiés entre 2006 et 2009. D'abord, les snowbirds québécois ont bien choisi leur destination hivernale, car l'humeur y est la meilleure au pays. On apprend aussi qu'entre 14h et 16h, c'est l'heure critique. Tous les États émettent surtout des tweets à caractère négatif. La côte ouest est en général plus heureuse que la côte est. Et évidemment, tout le monde utilise plus joyeusement le clavier d'ordinateur le samedi, tandis que c'est le mardi qui connaît le pire creux de la semaine.
Données scientifiques?
Les auteurs en sont conscients: les «twitteux» ne constituent pas une population représentative des Américains. Un autre biais est dû au fait que ce soit un ordinateur qui évalue les tweets sur l'échelle de la joie, plutôt que de vrais cerveaux. On ne peut ainsi jamais être certain du bon classement des microtextes, puisque le sarcasme n'est pas décodé, tout comme les expressions. D'autant plus que le lexique des Américains diffère d'une région du pays à une autre.
Néanmoins, cet exercice «a permis de constater le potentiel de Twitter, croit Sune Lehmann. Un tweet ne veut rien dire, mais des millions, c'est beaucoup d'information. Si on croise ces informations avec des sondages traditionnels ou avec les données météorologiques, qui influencent certainement l'humeur, ça peut devenir très intéressant». Et c'est justement la prochaine étape que franchira le groupe de chercheurs.
On est toutefois très loin du jour où Twitter sera une option à la question du formulaire long au recensement, à en écouter Madeleine Pastinelli, professeure spécialisée en communication électronique à l'Université Laval et auteure de Des souris, des hommes, des femmes et une ethnologue au village global: parole, pratiques identitaires et lien social dans un espace de bavardage électronique estime qu'on est loin de pouvoir récolter des données qui soient utiles pour l'instant. «Je trouve extrêmement dangereuse l'illusion de sérieux de ce genre de démarche. Le nombre [de microbillets analysés] donne une impression de rigueur. Ça pourrait faire en sorte que des subventionnaires jugent cette démarche plus pertinente.»
Sune Lehmann spécule et réplique que l'abondance de données donne tout de même un «signal», puisque les données trompeuses ne sont probablement pas majoritaires et se perdent dans le flot de «bonnes» données. Mais reste la question du sens, que l'ordinateur peinera peut-être à trouver: l'analyse de ces millions de mots ne réussit pas à nous dire pourquoi les Américains souffrent au travail entre 14h et 16h!
Twitter les tendances
Le contenu des tweets n'est tout de même pas sans valeur. Après tout, les internautes y jasent de ce qui les intéresse ou les touche. Par sa forme restreinte à un nombre maximal de caractères, ils vont peut-être même à l'essentiel.
Le coloré chroniqueur à la Revanche des nerdz Pascal Forget est de ceux qui croient que Twitter est bien plus que du bruit, bien plus que des mots vides. «Les réseaux sociaux sont des baromètres d'intérêt formidables. Le prochain artiste populaire? Le succès d'un produit, d'un film? On peut le voir avec Twitter et les réseaux sociaux. J'imagine qu'on pourrait même mieux prédire le cours de la Bourse qu'avec les méthodes actuelles!» blague-t-il.
Si l'analyse des messages publiés sur les réseaux sociaux en est encore à ses balbutiements dans la communauté scientifique, les entreprises en quête de données sur le marché risquent de les trouver fort intéressantes. «Les outils d'analyse de la "statusphere" vont exploser dans les prochaines années pour nous aider à mieux comprendre, mieux analyser ces données», prédit Sébastien Provencher, le cofondateur de Praized média, une jeune boîte qui développe des logiciels pour les médias sociaux.
|
Édition abonné
La version longue de certains articles (environ 1 article sur 5) est réservée aux abonnés du Devoir. Ils sont signalés par le symbole suivant :
|
Envoyer Fermer
Haut de la page

