mercredi 19 décembre 2012

1000 articles vitaux


Je suis passionné de données sur Wikipédia, mais souvent la frustration guette : l’encyclopédie a beau être menée comme un projet, elle n’a pas de planning, pas d’objectif chiffré, pas de recensement des ressources, pas d’évaluation des risques, etc. Cela n’empêche pas le projet de fonctionner, mais c’est tout de même dommage d’avoir aussi peu de statistiques.

Cela laisse la porte ouverte à des opinions personnelles qui ne reposent que sur des impressions fugitives : « la Wikipédia anglophone est plus complète et plus riche », ou bien « les allemands montrent plus de rigueur ». Il est difficile de ne pas écouter, même sans chiffres à l’appui. Certes, quelques indicateurs de qualité existent, mais j’ai du mal à me les représenter :
  • Le ratio « Articles labellisés / Nombre d’articles » est un classique. A mes yeux, il est inutile car sa valeur ne change pas : le rythme de labellisation des articles ne surpassera jamais celui des créations, d’où une convergence autour d’une valeur faible.
  • La « profondeur » des Wikipédias permet de mesurer le degré de collaboration, en calculant de manière globale la fréquence d’éditions des articles et la présence de pages dans l’espace non encyclopédique. L’indicateur est sans doute intéressant, mais je trouve le calcul peu visuel.
  • Le nombre de « pages vues » ou le « nombre de lecteurs » nous renseigne sur le succès de l’encyclopédie, mais la notion de projet est absente.
  • Le « nombre de contributeurs » n’a, par expérience, pas de lien direct avec la qualité encyclopédique des articles.

Aussi ai-je commencé une comparaison de la qualité avec la wikipédia anglophone. Celle-ci possède une liste des 1000 articles les plus importants, appelée « Vital articles ». En plus d’être pertinente à mes yeux (plus que la « List of articles every Wikipedia should have » par exemple), elle répertorie les avancements des articles listés. J’ai traduit cette liste, et ajouté les avancements des articles francophones.

Le résultat est visible en cliquant sur ce lien.

Cette liste permet de calculer un ratio de qualité globale qui ne peut qu’augmenter (en éliminant l’ « effet création d’articles »). Ensuite, il ouvre la porte à la comparaison entre les wikipédias anglophone et francophone. Enfin, nous pourrons observer avec le temps l’évolution de la qualité, et en particulier de visualiser le passage entre les avancements « ébauche », « BD », et « B », mouvement majoritaire des articles et assez peu documenté.

Enfin, avant de vous montrer les résultats, quelques précisions de méthode :
  • Je n’ai pas trouvé d’équivalent satisfaisant pour 13 des articles de la liste originelle. Aussi n’y a-t-il que 987 articles répertoriés et 13 liens rouges (temporaires sûrement).
  • La Wikipédia anglophone dispose de plus de stades d’avancements, donc j’ai établi la correspondance suivante :

  • J’ai fait confiance à l’évaluation actuelle des articles, pour ne pas y passer trop de temps.

  
Voici les données brutes des deux encyclopédies, regroupées par thème :


Du côté de la Wikipédia francophone, plusieurs thèmes sortent du lot : « Arts et culture », « Philosophie et religion », « Société et sciences sociales », « Mathématiques » ont plus de 60% d’articles en avancement E ou BD. A l’inverse, deux thèmes ont une image plus positive : les « biographies » ont 15% d’articles labellisés, et 10 % pour la « géographie ». La « santé et médecine » est le seul domaine sans le moindre label.


Ensuite, j’ai répertorié quelques sous-thèmes (de plus de 10 articles) avec des statistiques intéressantes. Quatre d’entre eux ont 60% ou plus d’articles en avancement B : Mention spéciale à l‘astronomie pour un taux à 70 % et aux biographies de leaders politiques qui labellisent 20 % de leurs articles. Les spécialités les moins bien dotées sont celles en rouge : l’économie est un parent pauvre de la Wikipédia francophone, avec 42 % d’ébauche.

Je fais un bref focus sur notre rayon littéraire, l’un des plus faibles de cette analyse. Aucun article qualifié d’une importance maximum ne dépasse l’avancement BD. Loin de généraliser à l’ensemble du portail, on peut y voir une explication de la méfiance de professeurs de lettres envers Wikipédia.


La Wikipédia anglophone possède de bien meilleurs articles dans cette liste. Ce qui saute aux yeux, c’est qu’il n’y aucune ébauche.

Trois thèmes seulement ont plus de 50 % d’articles en avancement E ou BD : « Arts et culture », « Vie quotidienne » et « Société et sciences sociales ». Je note aussi quatre thèmes qui ont plus de 50 % d’articles en avancement B. Enfin, trois thèmes sortent vraiment du lot : « Biographies », « Santé et médecine » et « Sciences » avec chacun 30 % d’articles labellisés.



Parmi les sous-thèmes de plus de 10 articles, seule la philosophie a plus de 70 % des articles en avancement E ou BD. A l’inverse, d’autres sont d’un bon niveau (« Eau » avec 70 % d’articles en avancement B par exemple) ou tout simplement exceptionnels : 40 % de labels pour les « maladies », 50 % des biographies de leaders politiques et surtout 70 % des articles d’ « astronomie ».



Deux derniers points pour conclure cet article :
  • Connaissez-vous le projet Sélection Transversale ? Au point mort depuis quelques années, il pourrait être réveillé pour héberger cette liste, et donc faciliter le travail sur ces sujets importants. De plus, l’analyse peut être complétée en intégrant le nombre de lectures, ou le nombre de contributions, par exemple avec le projet « Pages populaires ».
  • Chacun peut mettre à jour les avancements des articles. Toutefois, il faut veiller à conserver une liste strictement équivalente à celle des anglophones pour faciliter les comparaisons. Je prévois de refaire le même genre d’analyse à fin juin 2013.

jeudi 1 novembre 2012

Avoir confiance dans l’avenir de Wikipédia


Nous avons tous lu dans la presse d’innombrables prévisions sur l’échec programmé de Wikipédia. La plupart d’entre elles portaient sur l’inexactitude chronique de l’encyclopédie, mais ces derniers temps, elles se focalisent sur notre fonctionnement interne. Toutefois, ces actualités restent de véritables non-événements, vu l’échelle des enjeux réellement affrontés par Wikipédia.

D’autres tendances me semblent beaucoup plus lourdes d’importance pour l’avenir de l’encyclopédie, synthétisées ci-dessous dans une matrice SWOT.




Je détaille rapidement tous les points, mais chacun des sujets mérite plus qu’un billet de blog pour être exhaustivement débroussaillé.

Forces

  • L’intelligence des contributeurs de Wikipédia est la plus grande force de frappe dont nous disposons. La recherche permanente d’un consensus, la capacité à chercher de l’information, la création de méthodes de travail, la ténacité, l’imagination, la curiosité, sont des qualités qui rendent tout wikipédien inarrêtable. Quelques dizaines de figures de  la Wikipédia francophone me paraissent au-dessus du lot : Gemini1980, Azurfrog, Matpib, Like tears in rain, Lomita, pour ne citer qu’eux. Transformer cette force en une meilleure confiance en soi sera notre plus grande ressource.
  • L’existence d’une communauté de wikipédiens permet de créer des règles de vie, pour partager nos idées, les structurer et les confronter. Les difficultés sont surmontées ensemble, malgré les désaccords, car les valeurs qui nous unissent sont plus importantes que le simple désaccord. Enfin, un objectif commun nous donne l’assurance que l’avenir du projet est assuré : le départ d’un wikipédien ne provoquera jamais le Déluge.
  • La souplesse des critères d’amissibilité a légitimé la portée encyclopédique de nombre d’articles. Ils ne sont toutefois qu’un indicateur de notoriété, seules les sources apportent une preuve irréfutable. Le système est à la fois bienveillant et impitoyable : s’il est aisé de créer des articles, les procédures de suppression garantissent la cohérence de Wikipédia en examinant chaque source de notoriété sans la moindre pitié.
  • Chaque projet Wikimédia est un ballon d’oxygène pour l’encyclopédie (au même titre que Wikidata désormais). Ces ressources annexes permettent d’alléger, de clarifier et de fiabiliser le contenu sur Wikipédia. Nos axes de travail se renouvellent constamment. Par exemple, Wikipédia a commencé en diffusant le savoir au travers d’une encyclopédie libre, puis Commons s’est chargé de la gestion des illustrations d’articles, et Wikisource de la diffusion des textes libres. D’autres projets sont envisagés (Wikitravel, et bientôt un Commons de supports vidéos ?) : les frontières de Wikipédia n’ont pas encore été imaginées.

Opportunités

  • La légitimité acquise de Wikipédia assure une audience stable de lecteurs, permettant donc de travailler avec plus de sérénité. Nous savons qu’il ne suffit pas d’écrire des articles de qualité pour être lu mondialement, donc le projet fonctionne et nous pouvons répartir nos forces dans des domaines moins urgents, mais tout aussi importants (accessibilité, applications mobile, Afripédia, etc.). Plusieurs stratégies sont possibles, il n'y a pas de chemin unique.
  • Wikipédia est un poids lourd dans le monde des licences libres. C’est le premier site Internet non marchand, et sa valeur économique doit se compter en milliards d’euros (nous reviendrons sur la valeur d’un seul contributeur). Le regard sur les questions de propriété change, l’accès à l’information s’élargit, les obstacles rencontrés par l’encyclopédie sont partagés par des millions de personnes. Wikipédia parle peu, mais sera beaucoup écoutée.

 Faiblesses

  • Le renouvellement des types de contributeurs est difficile (je mentionne tout de même l’apparent succès des projets GLAM aux Etats-Unis ou au Royaume-Uni), et de nombreuses populations restent loin de l’encyclopédie : femmes, universitaires, polyglottes. Cela nuit à l’inscription de Wikipédia dans un patrimoine humain universel, et à la diversité des sujets traités.
  • La communauté wikipédienne manque d’expérience. Elle fait preuve d’une vraie ténacité, d’une véritable intelligence, mais ses capacités d’adaptation n’ont pas encore été testées : saurons-nous accepter que des vues contraires à celles des fondateurs prennent de l’ampleur ? En allant chercher des universitaires, des femmes, des « étrangers », c’est aussi ouvrir la porte à de nouvelles idées, alors que notre rythme de décision est par nature plutôt lent. On oublie trop souvent que Wikipédia est encore jeune, et n’a pas encore connu l’essentiel de ses problèmes. Pour survivre, il faudra adapter les dynamiques des communautés, et ce manque d’expérience est dangereux à long terme : un benchmark sur la longévité de communautés semblables est indispensable.
  • En 2001, la diffusion du concept « wiki » était un élément primordial dans la spécificité de Wikipédia : le modèle technologique était alors radicalement différent des autres sites Internet. Wikipédia a peu ou prou conservé les mêmes fonctionnements depuis 10 ans, d’où un retard technologique aujourd’hui perceptible : les traductions encore majoritaires au dictionnaire, ergonomie et design dépassés (cf. Facebook, Twitter, les produits Apple), pas de statistiques en temps réel, robots développés par les utilisateurs-mêmes, documentation sur le fonctionnement de MediaWiki illisible pour un néophyte.
  • Le manque de coopération internationale, et donc de coordination, est un risque sous-estimé. Les wikipédiens se fragmentent en de multiples communautés linguistiques, fortement indépendantes les unes des autres (à l’exception peut-être de MediaWiki, bien qu’américano-centrée). Les impacts des projets globaux (hors Mediawiki) sont d’une portée négligeable pour les projets, les liens interlangue ont une utilité très relative, les modèles sont unilingues. Tout cela nuit à l’existence d’une voix wikipédienne unique, malgré la présence historique de Jimmy Wales.

Menaces

  • La baisse du nombre de contributeurs sur la Wikipédia anglophone n’est pas inquiétante en soi, c’est plutôt qu’elle n’est pas compensée par les pays émergents (Inde, Chine, Afrique, monde arabe). La crédibilité de Wikipédia (désoccidentaliser les savoirs) dépend en grande partie de sa capacité à couvrir non seulement l’ensemble des domaines du savoir, mais aussi de rassembler au sein du projet les principales cultures du monde. L’échec d’un projet similaire en Inde montre que le chemin qui reste à parcourir est plus long qu’on ne croit.
  • La notion de concurrence est difficile à appréhender, car cette menace reste diffuse. Les concurrents naturels ont été piétinés, parce que Wikipédia avait une conception de la connaissance bien plus large et dynamique. Mais le vide concurrentiel ne doit pas cacher l’actuelle diversification des mastodontes du marché de l’information, qui finiront par considérer Wikipédia comme un concurrent. A long terme, il y aura confrontation et/ou intégration :
    1. Par exemple, Facebook peut créer des pages miroir de Wikipédia, et copier-coller les contenus : facile à coder, et concurrence immédiate en termes d’audience.
    2. A l’inverse, une coopération technologique Google-Wikipédia ferait des synergies hors du commun.
  • Le droit de propriété intellectuelle est important pour le développement de Wikipédia. Les tendances législatives dans le monde entier semblent vouloir mettre sous surveillance la circulation de l’information sur Internet. Les années 2011/2012 sont riches en black-out (Wikipédia anglophone, Russie, Italie I et II), et les gouvernements n’abandonnent pas le morceau. Les nouveaux prétextes du mouvement Anonymous et le retour de MegaUpload dans une version « Foutage de gueule » ne risquent pas d’arranger les choses. Quant à la loi Mickey, peut-être aurons-nous droit à une version 2 dans quelques années ? Wikipédia peut jouer un rôle pédagogique sur la législation.

mardi 7 août 2012

A la recherche de l'article parfait

Une poignée d’articles seulement peut prétendre au statut de « Meilleur article de la Wikipédia francophone ». Mes favoris personnels sont la chaîne des Cascades, la fée, la conservation de la viande, et quelques autres. D'ailleurs, à n'en choisir qu’un seul, ce serait Hameau de la Reine : l’écriture générale, l’insertion des références, et la qualité supérieure des photographies font pencher la balance.

Mais cet article ne fera jamais l’unanimité. En fait, seul un article parfait peut prétendre à l’unanimité. Aussi ai-je imaginé des critères de qualité pour l’article parfait, pour aller au-delà d’une simple étoile dorée en haut à droite. Ces critères reposent sur deux points :
  • La validation des pairs : chaque étape ou presque nécessite une revue des articles traités (quelques validations sont toutefois tacites) ;
  • L’usage à grande échelle des liens internes, des liens interlangues et des projets annexes : chaque lien vers une ressource est important, car il y a une foule de petits concepts annexes à maîtriser pour aller au fond du sujet.
Voici le tableau d’avancement vers un article parfait. Le niveau 32 est la consécration ultime.


L’article parfait est donc de niveau 32, quand l’article de qualité est de niveau 10. Bien que je ne parvienne plus à trouver des critères plus difficiles, il y a tout de même plus de 20 niveaux de différence.

Cette recherche de la perfection m’amène à me poser quelques questions :
  • Les liens internes servent d’abord à approfondir le contexte d’un sujet. Ils sont l’élément fondamental de wikipédia. Cet outil de navigation rend l’encyclopédie unique.
  • Les projets Wikimédia ont un énorme potentiel de ressources complémentaires. Dans 20 ans, Wikipédia ne sera pas dépassé par des entreprises concurrentes grâce aux soutiens de ces projets annexes.
  • L’utilité des liens interlangues est faible. Ils apportent plus au contributeur qu’au lecteur. Pour ce qui est du benchmark, c’est sympa, mais ils ne sont pas réellement utiles pour des chercheurs ou des étudiants.
Atteindre un tel niveau d’excellence est un travail qui nécessite une coopération interdisciplinaire et internationale. Et vous, quel est votre article préféré ?

mercredi 1 août 2012

Bienvenue à tous !

Bonjour,

Je m’appelle Nicolas, j’ai 25 ans, j’habite à Paris et j’ai un job depuis bientôt un an. Ah oui, j’écris aussi des articles sur Wikipédia. En toute humilité, j’aime me dire que je suis un wikipédien. D’où le titre du blog, parce qu’à y réfléchir, je trouve que ces années d’utilisation de Wikipédia, plutôt lecteur que contributeur, m’ont doté de réflexes typiquement wikipédiens.

J’ai envie d’écrire un blog pour plusieurs raisons :
§  Partager les quelques réflexions que je me fais sur Wikipédia, espérant qu’elles seront pertinentes pour mes lecteurs ;
§  Parler de la communauté wikipédienne, atout fondamental de Wikipédia qui est très peu mis en avant ;
§  Ecrire ailleurs que dans ma page utilisateur, ce n’est pas pratique et ça manque de visibilité.

Bonne lecture, et je répondrai à vos remarques par mail ou dans les commentaires des posts. Mon pseudo sur Wikipédia est Consulnico.