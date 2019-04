MONTRÉAL — L’étude des canulars que les médias traditionnels publient le 1er avril offre des pistes intéressantes pour ensuite repérer les fausses nouvelles, ont constaté des chercheurs britanniques.

Des spécialistes du traitement du langage naturel de l’Université Lancaster ont comparé le langage des véritables articles au langage des canulars et des fausses nouvelles.

Les canulars et les fausses nouvelles sont plus faciles à lire, ont-ils dit, même s’ils sont habituellement composés de phrases plus longues.

Des détails essentiels à un article authentique — comme les noms, les lieux, les dates et les heures — sont plus rares dans les canulars et les fausses nouvelles. Ces derniers utilisent aussi davantage de pronoms de première personne comme «je» et «nous».

Les canulars et les fausses nouvelles se distinguent également des véritables articles par leur utilisation de noms propres comme «Trump» et «Hilary» — les canulars en utilisent moins, les fausses nouvelles en utilisent plus.

Sans grande surprise, les chercheurs ont aussi trouvé plus de fautes d’orthographe et de propos vulgaires dans les fausses nouvelles que dans les canulars et les articles authentiques. Les canulars contiennent enfin moins de dates et de signes de ponctuation que les véritables articles.

Un algorithme développé par ces chercheurs a été en mesure d’identifier 75 pour cent des canulars et 72 pour cent des fausses nouvelles. Si cet algorithme était nourri de canulars, il identifiait 65 pour cent des fausses nouvelles qui lui étaient présentées.

Les conclusions de cette étude seront présentées prochainement lors d’une conférence scientifique à La Rochelle, en France.

La Presse canadienne