Une approche linguistique pour la détection automatique de communautés d’expertise.

Le cas des forums de Doctissimo.

par Damien De Meyere

Avec pour promoteurs les professeurs François Lambotte (Social Media Lab, UCLouvain) et Cédrick Fairon (CENTAL, UCLouvain), ce projet de Damien de Meyere s’inscrit dans les mutations que connait l’information de santé sous l’impulsion des techniques de communication numérique. Pour l’heure, on s’est peu intéressé au processus de mise en débat des connaissances médicales sur Internet au travers du prisme linguistique. Pourtant, avec l’émergence et l’importante popularisation des réseaux sociaux, nous assistons à l’émergence d’un nombre important de communautés en ligne qui mènent à la production d’un savoir collectif en constante élaboration.

Résumé

L’objectif de ce projet de recherche est double : il s’agit, d’une part, d’analyser les formes d’appropriation du registre de l’expertise sur les réseaux sociaux – et plus particulièrement sur les forums « Santé » du site Doctissimo – au travers du prisme de l’analyse linguistique. Il s’agit ensuite de formaliser nos observations en un ensemble de métriques linguistiquement motivées qui pourraient être exploitées pour quantifier le degré d’expertise d’un utilisateur sur la base de sa production dans plusieurs espaces de la plateforme, qui correspondent à différentes thématiques liées au domaine de la santé. Pour ce faire, nous nous reposerons à la fois sur les paradigmes existants en ce qui concerne

l’analyse de communautés, mais aussi les techniques d’analyse linguistique, et plus particulièrement de traitement automatique du langage. Cette analyse linguistique automatique du contenu partagé sur les plateformes collaboratives comme Doctissimo pourra être valorisée de multiples manières. Tout d’abord, il sera possible de mettre au point des visualisations permettant à l’animateur de communauté d’identifier les différents groupes de compétences mobilisées sur la plateforme, d’étudier leur évolution au fil du temps et d’exploiter ces résultats à des fins d’animation de la communauté. Ensuite, du point de vue de l’utilisateur à la recherche d’information, un classement du contenu en

fonction du niveau d’expertise de son auteur lui permettra de trouver plus rapidement du contenu fiable qui correspond à ses attentes. Enfin, du point de vue de l’utilisateur producteur d’information, notre analyse nous permettra de lui retourner une certaine mesure de soi quant à son activité sur la plateforme, de lui recommander du contenu en lien avec ses domaines d’expertise, l’inciter à interagir avec d’autres utilisateurs et ainsi éviter la lassitude sur le long terme.

Partenaires du projet