mercredi 19 décembre 2012

1000 articles vitaux


Je suis passionné de données sur Wikipédia, mais souvent la frustration guette : l’encyclopédie a beau être menée comme un projet, elle n’a pas de planning, pas d’objectif chiffré, pas de recensement des ressources, pas d’évaluation des risques, etc. Cela n’empêche pas le projet de fonctionner, mais c’est tout de même dommage d’avoir aussi peu de statistiques.

Cela laisse la porte ouverte à des opinions personnelles qui ne reposent que sur des impressions fugitives : « la Wikipédia anglophone est plus complète et plus riche », ou bien « les allemands montrent plus de rigueur ». Il est difficile de ne pas écouter, même sans chiffres à l’appui. Certes, quelques indicateurs de qualité existent, mais j’ai du mal à me les représenter :
  • Le ratio « Articles labellisés / Nombre d’articles » est un classique. A mes yeux, il est inutile car sa valeur ne change pas : le rythme de labellisation des articles ne surpassera jamais celui des créations, d’où une convergence autour d’une valeur faible.
  • La « profondeur » des Wikipédias permet de mesurer le degré de collaboration, en calculant de manière globale la fréquence d’éditions des articles et la présence de pages dans l’espace non encyclopédique. L’indicateur est sans doute intéressant, mais je trouve le calcul peu visuel.
  • Le nombre de « pages vues » ou le « nombre de lecteurs » nous renseigne sur le succès de l’encyclopédie, mais la notion de projet est absente.
  • Le « nombre de contributeurs » n’a, par expérience, pas de lien direct avec la qualité encyclopédique des articles.

Aussi ai-je commencé une comparaison de la qualité avec la wikipédia anglophone. Celle-ci possède une liste des 1000 articles les plus importants, appelée « Vital articles ». En plus d’être pertinente à mes yeux (plus que la « List of articles every Wikipedia should have » par exemple), elle répertorie les avancements des articles listés. J’ai traduit cette liste, et ajouté les avancements des articles francophones.

Le résultat est visible en cliquant sur ce lien.

Cette liste permet de calculer un ratio de qualité globale qui ne peut qu’augmenter (en éliminant l’ « effet création d’articles »). Ensuite, il ouvre la porte à la comparaison entre les wikipédias anglophone et francophone. Enfin, nous pourrons observer avec le temps l’évolution de la qualité, et en particulier de visualiser le passage entre les avancements « ébauche », « BD », et « B », mouvement majoritaire des articles et assez peu documenté.

Enfin, avant de vous montrer les résultats, quelques précisions de méthode :
  • Je n’ai pas trouvé d’équivalent satisfaisant pour 13 des articles de la liste originelle. Aussi n’y a-t-il que 987 articles répertoriés et 13 liens rouges (temporaires sûrement).
  • La Wikipédia anglophone dispose de plus de stades d’avancements, donc j’ai établi la correspondance suivante :

  • J’ai fait confiance à l’évaluation actuelle des articles, pour ne pas y passer trop de temps.

  
Voici les données brutes des deux encyclopédies, regroupées par thème :


Du côté de la Wikipédia francophone, plusieurs thèmes sortent du lot : « Arts et culture », « Philosophie et religion », « Société et sciences sociales », « Mathématiques » ont plus de 60% d’articles en avancement E ou BD. A l’inverse, deux thèmes ont une image plus positive : les « biographies » ont 15% d’articles labellisés, et 10 % pour la « géographie ». La « santé et médecine » est le seul domaine sans le moindre label.


Ensuite, j’ai répertorié quelques sous-thèmes (de plus de 10 articles) avec des statistiques intéressantes. Quatre d’entre eux ont 60% ou plus d’articles en avancement B : Mention spéciale à l‘astronomie pour un taux à 70 % et aux biographies de leaders politiques qui labellisent 20 % de leurs articles. Les spécialités les moins bien dotées sont celles en rouge : l’économie est un parent pauvre de la Wikipédia francophone, avec 42 % d’ébauche.

Je fais un bref focus sur notre rayon littéraire, l’un des plus faibles de cette analyse. Aucun article qualifié d’une importance maximum ne dépasse l’avancement BD. Loin de généraliser à l’ensemble du portail, on peut y voir une explication de la méfiance de professeurs de lettres envers Wikipédia.


La Wikipédia anglophone possède de bien meilleurs articles dans cette liste. Ce qui saute aux yeux, c’est qu’il n’y aucune ébauche.

Trois thèmes seulement ont plus de 50 % d’articles en avancement E ou BD : « Arts et culture », « Vie quotidienne » et « Société et sciences sociales ». Je note aussi quatre thèmes qui ont plus de 50 % d’articles en avancement B. Enfin, trois thèmes sortent vraiment du lot : « Biographies », « Santé et médecine » et « Sciences » avec chacun 30 % d’articles labellisés.



Parmi les sous-thèmes de plus de 10 articles, seule la philosophie a plus de 70 % des articles en avancement E ou BD. A l’inverse, d’autres sont d’un bon niveau (« Eau » avec 70 % d’articles en avancement B par exemple) ou tout simplement exceptionnels : 40 % de labels pour les « maladies », 50 % des biographies de leaders politiques et surtout 70 % des articles d’ « astronomie ».



Deux derniers points pour conclure cet article :
  • Connaissez-vous le projet Sélection Transversale ? Au point mort depuis quelques années, il pourrait être réveillé pour héberger cette liste, et donc faciliter le travail sur ces sujets importants. De plus, l’analyse peut être complétée en intégrant le nombre de lectures, ou le nombre de contributions, par exemple avec le projet « Pages populaires ».
  • Chacun peut mettre à jour les avancements des articles. Toutefois, il faut veiller à conserver une liste strictement équivalente à celle des anglophones pour faciliter les comparaisons. Je prévois de refaire le même genre d’analyse à fin juin 2013.

jeudi 1 novembre 2012

Avoir confiance dans l’avenir de Wikipédia


Nous avons tous lu dans la presse d’innombrables prévisions sur l’échec programmé de Wikipédia. La plupart d’entre elles portaient sur l’inexactitude chronique de l’encyclopédie, mais ces derniers temps, elles se focalisent sur notre fonctionnement interne. Toutefois, ces actualités restent de véritables non-événements, vu l’échelle des enjeux réellement affrontés par Wikipédia.

mardi 7 août 2012

A la recherche de l'article parfait

Une poignée d’articles seulement peut prétendre au statut de « Meilleur article de la Wikipédia francophone ». Mes favoris personnels sont la chaîne des Cascades, la fée, la conservation de la viande, et quelques autres. D'ailleurs, à n'en choisir qu’un seul, ce serait Hameau de la Reine : l’écriture générale, l’insertion des références, et la qualité supérieure des photographies font pencher la balance.

Mais cet article ne fera jamais l’unanimité. En fait, seul un article parfait peut prétendre à l’unanimité. Aussi ai-je imaginé des critères de qualité pour l’article parfait, pour aller au-delà d’une simple étoile dorée en haut à droite. Ces critères reposent sur deux points :
  • La validation des pairs : chaque étape ou presque nécessite une revue des articles traités (quelques validations sont toutefois tacites) ;
  • L’usage à grande échelle des liens internes, des liens interlangues et des projets annexes : chaque lien vers une ressource est important, car il y a une foule de petits concepts annexes à maîtriser pour aller au fond du sujet.
Voici le tableau d’avancement vers un article parfait. Le niveau 32 est la consécration ultime.


L’article parfait est donc de niveau 32, quand l’article de qualité est de niveau 10. Bien que je ne parvienne plus à trouver des critères plus difficiles, il y a tout de même plus de 20 niveaux de différence.

Cette recherche de la perfection m’amène à me poser quelques questions :
  • Les liens internes servent d’abord à approfondir le contexte d’un sujet. Ils sont l’élément fondamental de wikipédia. Cet outil de navigation rend l’encyclopédie unique.
  • Les projets Wikimédia ont un énorme potentiel de ressources complémentaires. Dans 20 ans, Wikipédia ne sera pas dépassé par des entreprises concurrentes grâce aux soutiens de ces projets annexes.
  • L’utilité des liens interlangues est faible. Ils apportent plus au contributeur qu’au lecteur. Pour ce qui est du benchmark, c’est sympa, mais ils ne sont pas réellement utiles pour des chercheurs ou des étudiants.
Atteindre un tel niveau d’excellence est un travail qui nécessite une coopération interdisciplinaire et internationale. Et vous, quel est votre article préféré ?

mercredi 1 août 2012

Bienvenue à tous !

Bonjour,

Je m’appelle Nicolas, j’ai 25 ans, j’habite à Paris et j’ai un job depuis bientôt un an. Ah oui, j’écris aussi des articles sur Wikipédia. En toute humilité, j’aime me dire que je suis un wikipédien. D’où le titre du blog, parce qu’à y réfléchir, je trouve que ces années d’utilisation de Wikipédia, plutôt lecteur que contributeur, m’ont doté de réflexes typiquement wikipédiens.

J’ai envie d’écrire un blog pour plusieurs raisons :
§  Partager les quelques réflexions que je me fais sur Wikipédia, espérant qu’elles seront pertinentes pour mes lecteurs ;
§  Parler de la communauté wikipédienne, atout fondamental de Wikipédia qui est très peu mis en avant ;
§  Ecrire ailleurs que dans ma page utilisateur, ce n’est pas pratique et ça manque de visibilité.

Bonne lecture, et je répondrai à vos remarques par mail ou dans les commentaires des posts. Mon pseudo sur Wikipédia est Consulnico.