Sept Illusions De La Méta Utopie

Bloc Résumé
Ceci est une tentative de traduction française de "Putting the torch to seven straw-men of the meta-utopia" (http://www.well.com/~doctorow/metacrap.htm) par Cory Doctorow. -- Clément Pillias

Fallaces De La Méta Utopie


Mise en évidence de sept illusions de la Méta Utopie

1. Introduction

Les Méta Données sont des "données à propos de données" -- des informations telles que mot-clefs, tailles de pages, titres, nombre de mots, résumés, localisations géographiques, SKU, ISBN, etc. Le concept de méta-donnée explicite, générée par des humains, a enthousiasmé ceux qui ont défini les récentes orientations du web, en particulier dans le monde du XML. Un scénario typique est le suivant : un certain nombre de fournisseurs se regroupent et s'accordent sur un standard de méta-données -- une DTD (Document Type Definition) ou un schéma XML -- pour un domaine donné, par exemple les machines à laver. Ils s'accordent sur un vocabulaire commun pour décrire les machines à laver : taille, capacité, consommation d'énergie, consommation d'eau, prix. Ils créent des bases de données de leurs inventaires, qui sont entièrement ou partiellement mises à disposition d'agents de recherche et d'autres bases de données, afin qu'un client puisse entrer les paramètres de la machine à laver qu'il recherche et interroger simultanément plusieurs sites pour obtenir une liste exhaustive des machines à laver disponibles qui correspondent à ses critères.

Si tout le monde faisait de la sorte et créait de bonnes méta-données dans le but de décrire leurs biens, services et informations, ce serait vraiment trivial de chercher sur Internet des informations hautement qualifiées et sensibles au contexte : un fan pourrait trouver toute la musique téléchargeable d'un genre donné, un fabriquant pourrait découvrir efficacement de nouveaux fournisseurs, les voyageurs pourraient facilement choisir une chambre d'hôtel pour un voyage proche.

Un monde de méta-données exhaustives et fiables est une utopie. C'est aussi un "pipe-dream" (?), basé sur l'auto-illusion (l'aveuglement ?), "nerd hubris" (?) et les opportunités d'un marché hysteriquement gonflé.

2. Les problèmes

Il y a au moins sept obstacles insurmontables entre le monde que nous connaissons et la Méta Utopie. Je vais les énumérer ci-dessous.

2.1 Les gens mentent

Les méta-données existent dans un monde compétitif. Les fournisseurs sont en compétition pour vendre leurs biens, les excentriques sont en compétition pour répandre leurs théories de cinglés (mea culpa), les artistes sont en compétition pour l'audience. Les bonnes intentions et les portefeuilles ne s'annulent peut-être pas, mais ils en sont diablement proches.

C'est pourquoi :

  • Une recherche avec n'importe quel terme communément référencé sur un moteur de recherche tel qu'Altavista donne souvent au moins un lien porno dans les dix premiers résultats.
  • Votre boîte à lettres est pleine de spam avec des sujets tels que "Re: L'information que vous avez demandée."
  • "Publisher's Clearing House" envoie des publicités clamant "Vous êtes peut-être déjà gagnant !"
  • Les communiqués de presse ont une liste gargantuesque de mot-clefs pompeux et vides de sens.

La Méta Utopie est un monde de méta-données fiables. Quand empoisonner le puits bénéficie aux empoisonneurs, la méta-eau devient horriblement toxique à cours terme.

2.2 Les gens sont paresseux

Vous et moi sommes engagés dans l'affaire incroyablement sérieuse de créer de l'information. Ici, dans la tour d'ivoire de l'information, nous comprenons l'importance de créer et maintenir d'excellentes méta-données pour notre information.

Mais les "civils de l'information" sont remarquablement cavaliers en ce qui concerne leurs informations. Votre tante "qui ne sait rien de rien" vous envoie des emails sans ligne de sujet, la moitié des pages sur Geocities s'appellent "Merci de donner un titre à cette page" et votre patron enregistre tous ses fichiers sur son bureau avec des noms parlants comme "sans titre.doc".

Cette paresse est sans fond. Aucun niveau de facilité d'utilisation n'y mettra fin. Pour comprendre la vraie profondeur de la méta-paresse, téléchargez dix fichiers MP3 sur Napster. Il y a des chances qu'au moins un n'ait pas de titre ou d'information sur l'artiste ou la piste -- et ce malgré le fait qu'ajouter cette information nécessite seulement de cliquer sur le bouton "Obtenir les informations sur la piste avec CDDB" sur n'importe quelle application de création de MP3.

A moins de casser les doigts des utilisateurs moyens ou de leur envoyer des escadrons d'info-ninjas vengeurs pour qu'ils ajoutent des méta-données à leurs fichiers, on n'y arrivera jamais.

2.3 Les gens sont stupides

Même lorsqu'il y a un intérêt positif dans la création de méta-données, les gens refusent régulièrement de prêter attention et de s'appliquer lors de la création de leurs méta-données.

Prenez eBay : chaque vendeur y a une sacrée bonne raison de vérifier par deux fois si sa liste est correctement écrite. Essayez de faire une recherche sur eBay avec "plam". En ce moment, cela renvoie neuf listes erronées pour "Palm Pilots". Ces listes mal écrites n'apparaissent pas dans les recherches correctement orthographiées et font donc l'objet de moins d'enchères et sont vendues moins cher. Vous pouvez presque toujours faire une affaire avec un "Plam Pilot" sur eBay.

Les détails (et les bases) de la littérature -- orthographe, ponctuation, grammaire -- sont ignorés par la vaste majorité des utilisateurs d'Internet. Croire que les utilisateurs vont soudainement et en masse (en français dans le texte) apprendre l'orthographe et la ponctuation -- catégoriser seuls et avec précision leurs informations selon la hiérarchie quelconque qu'ils sont censés utiliser -- est de l'auto-illusion du premier ordre.

2.4 Mission : Impossible -- connais-toi toi-même

En méta-Utopie, toute personne engagée dans l'occupation intellectuelle de décrire des choses pèse attentivement ces choses dans la balance et devine avec précision leurs propriétés, en notant le résultat.

Une simple observation démontre que cette supposition est fausse. Quand Nielsen demandait à ses familles-échantillons de noter ce qu'elles regardaient à la télévision dans des journaux de bord pour obtenir des informations sur leurs habitudes télévisuelles, le résultat était qu'elles étaient collées au "Masterpiece Theater" et à "Sesame Street". En remplaçant les journaux de bord par des boîtiers enregistrant automatiquement ces informations, on a mis en évidence ce que la famille américaine moyenne regardait vraiment : des combats de nains nus, le best-of des opérations de chirurgie esthétique les plus drôlement rafistolées, et Jerry Springer présentant "Ma fille s'habille comme une salope !".

Demandez à un programmeur combien de temps cela prendra d'écrire un module donné, ou à un entrepreneur combien de temps cela prendra pour réparer votre toit. Demandez à un sudiste laconique à quelle distance est la rivière. Mieux maintenant, lancez des fléchettes (!? "throw darts"... des dés peut-être ?) -- la réponse a des chances d'être aussi fiable.

Les gens sont de très mauvais observateurs de leurs propres comportements. Des religions entières sont formées dans le but d'aider les gens à mieux se comprendre eux-mêmes ; les thérapeutes ratissent des milliards en travaillant à cette finalité.

Pourquoi devrait-on croire qu'utiliser des méta-données va aider l'utilisateur à être en phase avec son karma ?

2.5 Les schémas ne sont pas neutres

En méta-Utopie, les savants gardiens de l'épistémologie s'asseyent et tracent rationnellement les contours d'une hiérarchie d'idées, quelque chose comme ceci :

Rien :

Trous noirs


Tout :

Matière :

Terre :

Planètes
Machines à laver

Vent :

Oxygène
Pets

Feu :

Fission nucléaire
Fusion nucléaire
Sauce épicée de Louisiane "Mean Devil Woman"

Dans un sous-domaine donné, disons, les machines à laver, les experts s'accordent sur des sous-hiérarchies, avec des classes pour la fiabilité, la consommation énergétique, la couleur, la taille, etc.

Ceci présuppose qu'il y a une manière "correcte" de catégoriser les idées, et que des personnes raisonnables avec suffisamment de temps et de motivation peuvent s'accorder sur la façon convenable de construire une hiérarchie.

Rien ne pourrait être plus éloigné de la vérité. Toute hiérarchie d'idées implique nécessairement que certains axes aient une importance plus grande que d'autres. Un fabriquant de petites machines à laver respectant l'environnement tracerait une hiérarchie qui ressemblerait à cela :

Consommation énergétique :

Consommation d'eau :

Taille :

Capacité :

Fiabilité

Tandis qu'un fabriquant de machines à laver clinquantes (? "glitzy") et bourrées d'options voudrait quelque chose comme ceci :

Couleur :

Taille :

Programmabilité :

Fiabilité

Imaginer que des intérêts compétitifs peuvent arriver à un accord facile sur un vocabulaire commun est ignorer totalement la puissance des principes d'organisation dans une place marchande.

2.6 Les métriques influencent les résultats

S'accorder sur une unité commune pour mesurer les choses importantes dans n'importe quel domaine privilégie nécessairement les éléments qui ont un bon score selon cette métrique, indépendamment de l'adéquation générale de ces éléments. Les tests de QI privilégient les personnes bonnes aux tests de QI, les classements de Nielsen privilégient les "shows" télé de 30 ou 60 minutes (c'est pourquoi MTV ne montre plus de vidéos -- Nielsen ne pouvait pas générer de classement pour des mini-programmes de trois minutes, et du coup MTV n'a pu démontrer l'intérêt de faire de la publicité sur son réseau), les méga-hertz bruts privilégient les chips CISC d'Intel au dépend des chips RISC de Motorola.

Certains axes de classement sont mutuellement exclusifs : les programmes qui ont de bonnes notes en sécurité ont de mauvais scores en confort d'utilisation, les desserts qui ont de bonnes notes en gourmandise ont de mauvaises notes en santé. Tout le monde veut mettre en avant les axes pour lesquels il obtient de bons scores et cacher (ou, si possible, ignorer) les axes pour lesquels il obtient de mauvais scores.

C'est prendre ses désirs pour des réalités de croire qu'un groupe de personnes en compétition sera universellement content avec une hiérarchie de connaissance. Le mieux qu'on puisse espérer est un compromis dans lequel tout le monde est également misérable.

2.7 Il y a plus d'une façon de décrire quelque-chose

"Non, je ne regarde pas des dessins animés ! C'est de l'anthropologie culturelle."

"Ce n'est pas taché, c'est de l'art."

"Ce n'est pas un début de calvitie, c'est un panneau solaire pour une machine sexuelle."

Des personnes raisonnables peuvent être définitivement en désaccord sur la façon de décrire quelque-chose. De façon discutable, votre Moi est l'ensemble des associations et descriptions que vous assignez aux idées. Demander que tout le monde utilise le même vocabulaire pour décrire son matériel appauvrit le paysage cognitif, renforce l'homogénéité des idées.

Et ce n'est pas bien.

3. Des méta-données fiables

Alors on jette les méta-données ?

Bien sûr que non. Les méta-données peuvent être utiles, si elles sont prises avec suffisamment de sel. La Méta Utopie ne verra jamais le jour, mais les méta-données sont souvent un bon moyen de faire des hypothèses grossières sur les informations qui voyagent sur Internet.

Certain types de méta-données implicites sont en fait terriblement utiles. Google exploite les méta-données concernant la structure du web : en examinant le nombre de liens pointant vers une page (et le nombre de liens pointant vers ces pointeurs), Google peut obtenir des statistiques sur le nombre d'auteurs qui considèrent que cette page est suffisamment importante pour faire un lien vers elle, et à partir de là faire d'excellentes hypothèses sur la réputation de l'information contenue par la page.

Les méta-données observables de cette sorte sont bien plus fiables que tout ce que les être humains créent dans le but qu'on trouve leurs documents. Cela évite la merde marketing, l'auto-illusion et les conflits de vocabulaire.

D'une façon plus générale, ce genre de méta-données peut être vu comme un pedigree : Qui pense que ce document a de la valeur ? A quel point les jugements de valeur de cette personne ont été proches des miens dans le passé ? Ce type d'approbation implicite de l'information est un candidat bien meilleur pour la panacée de la recherche d'information que tout les schémas du monde combinés.


Conversations :

Déplacées sur SeptIllusionsDeLaMétaUtopie /Conversations


Web Sémantique Recherche De Critique Wiki Méta Donnée Wiki Sémantique Projets Utopistes
Category Traduction Collaborative

Dernière modification le vendredi 13 octobre 2006 11:04:37

Éditer HistoriqueDeLaPage Diff  InfosSurLaPage