Florent DaudensEt si vous étiez prévisible sur Twitter?

par

 publié le 8 novembre 2012 à 12 h 42

Twitter« Non seulement rien n’arrive dans le monde qui soit absolument irrégulier, mais on ne saurait même rien feindre de tel ». Cette citation de Leibniz, empruntée par Aurélien Bellanger dans son livre La théorie de l’information, pourrait s’appliquer à Twitter.

En effet, des chercheurs du Massachusetts Institute of Technology (MIT) ont mis au point un algorithme capable d’identifier à l’avance les sujets qui seront les plus populaires sur le réseau de microblogage.

Ces « trending topics » reflètent les mots-clics les plus utilisés par les utilisateurs à différents niveaux géographiques, par exemple #Qc2012 lors de la campagne électorale québécoise ou plus récemment #election2012 aux États-Unis. Certains sujets peuvent être éphémères, d’autres peuvent durer plus longtemps.

Or, les recherches de Devavrat Shah, un professeur d’informatique de 35 ans né en Inde, et de son étudiant Stanislav Nikolov, permettent de définir ce qui sera le plus populaire auprès des utilisateurs. Et ce, avec une heure et demie d’avance, en moyenne, et un taux de pertinence de 95 %, a assuré le premier à l’AFP.

Un algorithme intelligent

L’algorithme apprend en fonction du contexte. Il s’appuie sur une base de données de 200 sujets ayant bien marché et de 200 autres ayant plutôt fait un flop, afin d’en établir un modèle. Il compare chaque nouveau sujet et lui attribue un taux de probabilité de devenir populaire.

La particularité de son algorithme réside dans le fait qu’il ne repose pas sur un modèle de base, telle une hypothèse à vérifier. Il s’appuie plutôt sur les données brutes pour concevoir lui-même son hypothèse à tester. Ce type d’analyse exige d’énormes ressources informatiques, mais les données sont réparties sur plusieurs serveurs.

« La manière dont les êtres humains réagissent obéit à des caractéristiques bien particulières (et) il y a assez peu de façons différentes pour un sujet de devenir populaire sur Twitter. » – Devavrat Shah, chercheur au MIT

« Cette nouvelle approche de l’analyse statistique pourrait, en théorie, s’appliquer à n’importe quel type de données qui varient dans le temps, comme la durée d’un trajet en bus, les ventes d’entrées de cinéma et même le marché boursier », estime le MIT dans un communiqué.
« C’est plus une méthode qu’un algorithme destiné à un seul usage. Les applications sont multiples. Il n’y a rien de concret pour l’instant, mais ça promet d’être intéressant », a renchéri M. Shah.

Le chercheur présentera ses travaux vendredi au MIT.

Avec AFP

Pour me joindre :

florent.daudens@radio-canada.ca

Sur Facebook : http://www.facebook.com/surleweb