Google et la bibliothèque mondiale table ronde avec Jean-Noël Jeanneney, Hervé Le Crosnier et Agnès Saal

Janvier 2005 : en lançant son projet « Google Print », Google provoque l’accélération des projets mondiaux de numérisation. Initiative politique, ou strictement technique ? Que devient le métier de bibliothécaire, face à une mutation si radicale du paysage ? Nous avons souhaité reprendre avec Jean-Noël Jeanneney, président de la BnF, quelques questions soulevées par son appel à un contre-projet européen. Et lui faire rencontrer Hervé Le Crosnier, fondateur de la liste biblio.fr et figure de la vigilance face aux mutations du secteur. Table-ronde, en présence également d’Agnès Saal, directrice générale de la BnF.

Entre l’annonce faite par Google de numériser et de diffuser sur la Toile 15 millions d’ouvrages de certaines des plus grandes bibliothèques anglo-saxonnes et l’engagement politique de constitution d’une bibliothèque numérique européenne, consécutif à votre appel — Jean-Noël Jeanneney — cinq mois à peine ont passé. Comment expliquer un tel emballement ?

J.-N. Jeanneney. Il faut tout de même rappeler que l’annonce du projet Google Print n’a pas immédiatement provoqué de remous dans le monde politique français, ni dans les médias grand-public, comme s’il s’était agi d’une question purement technologique. Pourtant les choix techniques posent toujours des questions de sens, c’est-à-dire des questions politiques : un moteur de recherche comme Google permet de signaler des pages, quitte à ne produire qu’un savoir dispersé en poudre. Ensuite, la dimension anglo-saxonne du projet soulève des problèmes de contenu : quels seront les critères de choix de numérisation ? Enfin, on ne peut ignorer le caractère commercial de Google : la diffusion des ouvrages numérisés et leur plus ou moins grand degré de visibilité risquent d’être fonction des bénéfices économiques et publicitaires escomptés, selon le principe de la « tête de gondole » des supermarchés.

Soulever ces questions, en se situant à l’articulation de la technique, de la culture et de la politique, c’était se donner l’occasion d’une réflexion concrète sur le multilatéralisme en matière culturelle, comme il en existe dans les domaines du développement, de l’écologie, de la diplomatie ou de la défense : chez Google, on dit orgueilleusement qu’on a pour mission « d’organiser l’information mondiale ». J’ai donc proposé de réfléchir au niveau européen : en matière culturelle, les débats peinent souvent à sortir du cadre national — la façon dont est formulée, pour la télévision ou le cinéma, la question des quotas le montre assez. Il s’agissait donc d’imaginer ce que pourrait être une bibliothèque numérique européenne. C’est parce qu’il posait le problème dans ces termes que mon article, je pense, a suscité tant d’intérêt. Probablement la conjoncture a-t-elle aussi joué, avec le débat public sur la constitution européenne qui commençait tout juste.

H. Le Crosnier. Il était important de produire, comme vous l’avez fait, un texte politique. Après tout, le projet de numérisation des livres du domaine public possédés par les bibliothèques et leur mise à disposition sur la Toile n’est pas neuf — Gallica, la bibliothèque numérique de la BNF — existe depuis quinze ans. Si l’on s’en tient à un débat technique, celui de la maîtrise des algorithmes de traitement industriel (la numérisation en masse et l’indexation « probabiliste » à partir d’une transcription automatique en mode texte), on peut considérer la technique de Google comme « meilleure » que celle qui a été employée dans la construction des catalogues de bibliothèques, puisqu’elle permet de mettre en ligne des milliards de pages, alors que les premiers ont aujourd’hui du mal à gérer quelques millions de titres. Et c’est bien pourquoi de nombreux technophiles parient sur Google, et affichent leur scepticisme à l’égard d’une initiative comme celle que vous avez lancée. Mais si l’on s’extrait de la question technique, Google Print apparaît pour ce qu’il est : un élément dans une stratégie plus large de construction d’un média global. Pourquoi Google s’intéresse-t-il à des œuvres du passé qui ne lui rapportent rien ? Cela renvoie à une volonté impériale : les empires s’intéressent au passé pour négocier avec lui. La force idéologique de Google tient donc avant tout à sa position centrale dans le nouveau réseau des outils d’accès à la connaissance. À une époque où Internet est en passe de devenir un multi-média, l’enjeu est, pour un moteur de recherche, d’assurer le rôle de méta-média : celui qui tient le catalogue est celui qui l’emporte. Google est bien un outil de construction de l’audience et de sélection de l’information, en fonction de critères suggérés par ses commanditaires publicitaires. Parmi les milliards de pages indexées par Google, une vingtaine tout au plus sera sélectionnée par l’internaute au terme de sa consultation. Combien, dans cette vingtaine, seront gérés par la publicité ? On le sait, un média est vendu deux fois : à ses annonceurs et à ses lecteurs. La gratuité apparente de l’offre de Google est payée, en amont, par les annonceurs : soit une surdétermination du citoyen par le consommateur. C’est pourquoi les questions que vous posez sont des questions de régulation des médias : comment éviter les monopoles de l’information ?

J.-N. Jeanneney. La question du poids de la publicité est évidemment centrale. On voit mal pourquoi Google Print ne proposerait pas des liens publicitaires en relation avec l’objet de la demande de l’internaute : des bibliothèques vont donc apporter gratuitement leur patrimoine, pour le plus grand profit des actionnaires. Aujourd’hui, on assure chez Google que telle page de Proust ne sera pas assortie d’une publicité pour un fabriquant de madeleines ; mais je ne vois pas comment ils pourraient ne pas aller dans cette direction [1]. Mais l’essentiel concerne évidemment les textes sous droits — dont des extraits seulement seront disponibles, sous forme de « bande annonce » de quelques pages. C’est là que la question de la dépendance publicitaire pose les plus grands problèmes. Comment éviter que la richesse n’aille à la richesse ? Quel miroir tendra Google sur la culture actuelle ? Et quelle influence aura-t-il sur son développement, si ne naissent pas des projets concurrents, et différents ? Comment empêcher que soient écrasées les œuvres discrètes, qui seront peut-être les œuvres majeures de demain, mais qui ne sont aujourd’hui vendues qu’à deux cents exemplaires ?

H. Le Crosnier. Dès lors qu’on rentre dans une logique de média, on est confronté à des questions qui relèvent de l’économie de l’attention. L’économie des médias a jusqu’à présent reposé sur l’exploitation du conformisme : très peu d’œuvres sont vues par beaucoup de personnes ; la majorité des productions reste dans un quasi-anonymat. Or à l’inverse, la diversité culturelle se mesure au nombre de documents effectivement consultés. Pour limiter les tendances hégémoniques comme celles de Google, il faut donc inventer une méthode qui permette de repérer les documents minoritaires et d’en multiplier les modes d’accès : créer un média concurrent, fondé cette fois sur le modèle de l’économie de traîne, qui valorise, dans la longue durée, les documents ayant un nombre restreint de lecteurs. Or sur ce point, il faut clarifier plus encore le projet présenté dans votre livre [2] : d’un côté, vous plaidez pour la construction d’un moteur de recherche européen ; de l’autre, vous en appelez à la constitution d’une bibliothèque numérique européenne — ce qui est un objectif indispensable, mais beaucoup plus restreint.

J.-N. Jeanneney. Certes, mais il n’y a pas un choix à faire entre les deux : il s’agit plutôt d’un minimum et d’un maximum. Je défends l’idée d’un (ou de plusieurs) moteurs européens ; mais je n’ai évidemment pas les moyens de l’imposer, et j’ignore encore si l’Europe se donnera les moyens d’une telle ambition. Pour l’heure, c’est le projet coordonné de numérisation du patrimoine des bibliothèques européennes qui est le plus avancé. Ne soumettons pas sa réalisation à la certitude d’une réponse positive sur le ou les moteurs. Je l’avoue, j’ai été moi-même étonné de la rapidité et de la facilité avec lesquelles l’idée de cette « BNE » (on pourra chercher un nom plus poétique) a fait son chemin. Avec Agnès Saal, nous avons rédigé un document à l’intention des bibliothèques nationales, où nous expliquions que ce projet ne devait pas être le fait exclusif des bibliothèques ni des États : les pouvoirs publics doivent être garants du long terme — en cristallisant et coordonnant les efforts, tant dans l’ordre de la technologie que dans celui des contenus —, mais il serait absurde et délétère d’aller à l’encontre du génie de la Toile : celui du réseau et de la collaboration entre initiatives publiques et privées. Nous redoutions un réflexe frileux de certaines des grandes bibliothèques publiques européennes mais la quasi-totalité d’entre elles — à l’exception de la British Library et de la Bibliothèque nationale portugaise — ont donné leur agrément explicite. Puis le politique s’est saisi du projet : Jacques Chirac a obtenu le soutien de l’Espagne, de l’Italie, de la Hongrie, de l’Allemagne et de la Pologne ; Junker, puis Barroso, ont repris publiquement l’ambition à leur compte, avec éclat. Bref, sans préjuger de la possibilité de lancer un moteur européen, cette aventure est lancée.

Les chapitres que vous avez consacrés, Jean-Noël Jeanneney, à ce projet de bibliothèque numérique européenne restent très discrets sur la question des œuvres sous droits. Est-ce parce que vous craignez d’effaroucher les éditeurs ?

A. Saal. Le livre pose un principe sur lequel nous n’entendons pas revenir : celui du respect scrupuleux du dispositif français relatif au droit de la propriété littéraire et artistique — l’un des plus protecteurs des créateurs, en particulier en matière de droit moral. Même chez Google, on a compris qu’on ne parviendra à rien si on propose de le balayer d’un revers de main au prétexte qu’il serait obsolète.

Aujourd’hui, on sent bien que le projet Google Print perturbe considérablement les éditeurs. Il leur est en effet proposé de numériser gratuitement l’ensemble des textes de leur catalogue, dont quelques extraits seulement seront consultables : l’offre est tentante ! Le SNE (Syndicat National de l’Édition) nous a d’ailleurs témoigné des forces contradictoires qui s’exerçaient dans le monde de l’édition : personne n’a encore donné suite, mais chacun semble se demander lequel sera le premier à oser franchir le pas — sachant qu’il se fera sans doute fusiller, mais que les autres s’engouffreront dans la brèche.

Quant à nous, nous nous en tenons à la position qui est la nôtre depuis des années : outre la numérisation des ouvrages libres de droits, entreprise de longue date, nous caressons l’idée d’une numérisation intégrale, effectuée par nos soins, d’ouvrages sous droits, assortie de possibilités limitées d’accès. Un accès circonscrit aux emprises physiques de la bibliothèque est certes envisageable, et déjà pratiqué pour quelques milliers d’ouvrages, mais il ne peut pleinement nous satisfaire ; on pourrait donc imaginer un accès sur la Toile, moyennant — pourquoi pas ? — des systèmes de rémunération, afin que les auteurs et les éditeurs ne soient pas lésés et que l’équilibre économique du système soit assuré : à ce jour, nous ne sommes pas encore parvenus à les en convaincre, mais on peut espérer que le nouveau contexte contribuera à modifier la donne, d’autant qu’ils reconnaissent placer une plus grande confiance dans la BNF et dans la solidité des garanties qu’elle offre que dans la plupart de leurs autres interlocuteurs en cette matière.

Par ailleurs, nous négocions avec un ensemble de partenaires une participation de la Bibliothèque au projet CAIRN, un portail des revues de sciences humaines et sociales : il nous reviendrait d’assurer la conservation pérenne des revues numérisées dans ce cadre et d’y donner accès dans nos sites.

J.-N. Jeanneney. Au-delà de son intérêt propre, ce projet est pour nous l’occasion d’une exploration, dans un secteur circonscrit : les difficultés que nous aurons rencontrées et la façon dont nous les surmonterons seront instructives pour un projet de plus grande ampleur.

H. Le Crosnier. Attention à ne pas considérer comme figée la situation actuelle sur la question de la propriété intellectuelle et artistique. La perspective de la numérisation oblige à reposer collectivement la question de l’étendue du droit d’auteur. Il faudra bien se frotter à cette question, et exiger une renégociation : l’intégration de créations actuelles dans le projet de bibliothèque numérique européenne est indispensable, si l’on ne veut pas diffuser uniquement l’image surannée d’un vieux continent arc-bouté sur son patrimoine et son passé.

Depuis une dizaine d’années, nous sommes pourtant confrontés à un intégrisme du droit d’auteur, qui a complètement rompu l’équilibre sur lequel reposait le « modèle français ». Prenez l’exemple du portail des revues de sciences sociales : on demande aujourd’hui aux ayants droits des auteurs qui ont publié dans les années 1930 dans ces revues s’ils acceptent de donner le droit de numériser une œuvre qui avait déjà été donnée gratuitement à la revue, parce que telle était alors la pratique ! C’est purement idéologique !

Il y a donc urgence à prendre appui sur des pratiques de promotion du domaine public consenti par les auteurs eux-mêmes : je pense aux licences libres pour l’art ou le logiciel, aux archives ouvertes pour les publications scientifiques, ou aux licences Creative Commons pour la création littéraire. Sans doute ces pratiques sont-elles encore minoritaires, mais on peut commencer par là. Le réseau des bibliothécaires, avec sa culture de la gratuité et de l’universalité de l’accès à la connaissance, peut contribuer à lancer un mouvement que d’autres rejoindront.

Comment le milieu des bibliothécaires réagit-il à ces nouveaux enjeux ?

A. Saal. Le bibliothécaire joue un rôle éminent et central de médiateur entre les collections et les lecteurs. Pour ne parler que de la BNF, nous accompagnons depuis dix ans les lecteurs dans l’appropriation et la maîtrise des ressources électroniques. Mais on ne peut nier qu’une nouvelle étape s’annonce avec l’utilisation distante des documents numérisés, en dehors des sites physiques de la Bibliothèque. Des inquiétudes naturelles naissent parmi les professionnels des bibliothèques sur cette évolution du métier et des compétences, liées à la crainte d’une désertion progressive des bibliothèques. Il faut y répondre, d’autant plus que nous sommes intimement convaincus du maintien sur le long terme du recours à leur compétence essentielle de médiation et d’organisation du savoir.

J.-N. Jeanneney. Je crois moins en la concurrence des supports qu’en leur renforcement mutuel. Historiquement, l’apparition de chaque nouveau média a été accompagnée par la crainte de la disparition des précédents, qui n’a pas eu lieu. On peut parier que la fréquentation des textes sur la Toile amènera des internautes vers le livre de forme « classique », sur papier. Mais il y a plus : le développement des bibliothèques numériques va nécessiter, plus que jamais, des instances de validation. Comment indiquer aux lecteurs les documents qui méritent leur confiance ? C’est tout le problème du choix dans le désordre de l’offre, et donc celui de la nécessité d’une validation, qui permet de ne pas mettre tous les documents sur le même plan. Je cite dans mon livre une étude conduite aux États-Unis qui montre que 62% des internautes ne font pas de distinction entre les informations publicitaires et les autres. Les bibliothécaires ont un savoir-faire sur ce terrain : ils ne vont pas perdre leur rôle de médiateur. Celui-ci sera même d’autant plus important qu’il s’agit de se mettre au service d’autres médiateurs essentiels — les journalistes, les enseignants, mais aussi les libraires, qui sont également confrontés à la nécessité d’organiser l’immensité des connaissances, de donner les moyens de s’y repérer. Il y aura donc une perpétuation des fonctions des bibliothécaires, dans les choix de numérisation et la confection des métadonnées, ces éléments d’information qui accompagnent le texte à proprement parler.

La spécificité de la Toile ne permet-elle pas d’imaginer, pour ce qui concerne la validation, des formes de collaboration avec les utilisateurs eux-mêmes ?

J.-N. Jeanneney. Je consacre quelques pages à ces questions, entre autres autour du projet Gutenberg (www.gutenberg.org) — l’un des premiers projets de bibliothèque numérique organisée sur le principe de la conjonction du travail de volontaires dans le monde entier. On doit en effet pouvoir mettre à profit la déconcentration des réseaux permise par la Toile, et imaginer la coordination d’efforts démultipliés entre des acteurs bénévoles. Il ne s’agit évidemment pas d’étouffer la diversité des énergies sous un jacobinisme absurde. À l’inverse, il y aurait de la naïveté à croire que l’addition des bonnes volontés donne à coup sûr la meilleure des cultures possibles. Car ces projets se heurtent à une double question : celle du contrôle des données et de la rigueur scientifique des contenus ; et celle de l’unité des normes et des formats grâce à laquelle une interopérabilité est possible.

H. Le Crosnier.Ces méthodes ne règlent en effet pas toutes les questions — notamment celle du contrôle de qualité. Mais elles sont intéressantes. Voyez l’encyclopédie libre Wikipedia, par exemple, dont les internautes produisent et modifient les articles, sans contrôle éditorial a priori. Sa force est moins dans les sujets centraux de la connaissance que dans ses sujets périphériques, généralement négligés. Dans un système comme Internet, l’intelligence est aux extrémités. Il faut donc prendre appui sur ce type de pratiques. Parce qu’il a une compétence en termes de validation, le bibliothécaire peut devenir l’animateur d’un réseau, jouer le rôle de pivot dans la réorganisation de la connaissance en quoi consiste la reformulation numérique des documents. Il y a là un basculement épistémologique de la fonction des bibliothécaires : arrêter de se penser comme celui qui apporte des documents et des connaissances, mais comme celui qui propose des projets de co-construction du réseau documentaire.

J.-N. Jeanneney. D’autres inquiétudes relatives au développement des bibliothèques numériques sont régulièrement formulées : on a ainsi pu mettre l’accent sur le risque de surveillance des utilisateurs, liée à la possibilité technique de « tracer » la consultation des ouvrages, le risque de contrôle, aux deux sens du terme, le français et l’anglais.

H. Le Crosnier. Ce risque existe ; encore faut-il préciser ce qu’on entend par « contrôle ». Il ne s’agit pas seulement du risque de l’État policier. Prenez l’exemple d’un éditeur scientifique comme Elsevier : aujourd’hui, 60% de la production scientifique passe par lui. Voilà qu’il met en place Science Direct, un système de recherche automatique des articles dans des centaines de revues scientifiques. Dans ce cas, la bibliothèque est réduite au rôle de payeur : elle abonne son université à Science Direct et l’utilisateur se débrouille. Or Science Direct trace évidemment la recherche d’articles. D’abord pour cibler l’utilisateur avec son autorisation : on lui demande s’il veut recevoir des articles semblables à celui qu’il a commandé. Mais aussi pour repérer les mouvements : à un moment donné, des chercheurs partout dans le monde demandent telle ou telle chose dans tel ou tel domaine. L’agrégation des demandes crée donc un savoir extraordinairement avantageux, en termes de marketing (on peut lancer une nouvelle revue dans ce domaine) ; mais aussi en termes géopolitiques.

J.-N. Jeanneney. Un tel système est, en matière scientifique, éminemment conservateur, puisque cela conduit à privilégier ce qui existe déjà et dont témoigne la demande, au détriment des expériences plus fragiles, plus originales, mais peut-être aussi plus fécondes. Sur ce point, l’exemple de la littérature scientifique vaut pour tous les types de littérature. C’est bien pourquoi l’indépendance d’une bibliothèque numérique doit être absolument garantie.

H. Le Crosnier. Comment anonymiser la demande des lecteurs ? Comment garantir qu’elle ne sera pas communiquée ? Il faudra que l’agrégation de l’ensemble des demandes des bibliothèques soit faite à l’intérieur d’un réseau sans mémoire des usages.

Au-delà des risques que vous soulevez, ne peut-on considérer la possibilité de garder la trace à grande échelle des recherches documentaires comme un outil pour s’affranchir des classifications usuelles des bibliothèques ? Actuellement les lecteurs cherchent des rayons qui n’existent pas, les chercheurs construisent leurs objets en empruntant des voies imprévues ; et les bibliothécaires éprouvent sans cesse les limites des modes de classification en vigueur, à commencer par la « Dewey » [3].

H. Le Crosnier. Je ne doute pas de l’intérêt des enquêtes sur les pratiques de recherche documentaire et de lecture, pourvu qu’elles obéissent, comme toute recherche scientifique, à des protocoles transparents, contrôlables, et limités dans le temps. Je crains tout processus à long terme de traçage des activités culturelles.

Mais je partage votre avis sur la Dewey, qui renvoie à une représentation du monde héritée du XIXème siècle occidental. Dans certaines bibliothèques universitaires anglaises, les chercheurs ont le droit de se constituer un coin à eux, où ils retrouvent, pour une certaine durée, les livres sur lesquels ils travaillent : il y a là un phénomène intéressant, qui permet de faire émerger la capacité du lecteur à participer à l’organisation des livres. On peut aussi penser à l’expérience de la Library of Congress à Washington, qui a procédé à l’inverse des méthodes de la Dewey. Le bâtiment était immense et neuf : des salles avaient été réservées à des grandes classes disciplinaires — droit, histoire, etc. —, à l’intérieur desquelles des modes de classification inédits ont pu être inventés. En substance, les bibliothécaires ont procédé comme fait chacun d’entre nous pour ses propres rayonnages : selon la logique des liens. Plus les liens étaient nombreux entre deux livres, plus ils avaient de chance de se retrouver en proximité.

J’ai participé naguère au groupe de réflexion sur le mode de classification pour la BNF alors en construction. J’avais suggéré qu’on écrive de nouvelles tables, adaptées au monde moderne. J’étais jeune et utopiste ! La Dewey l’a emporté, avec de bons arguments d’ailleurs : à la différence des possibilités offertes aujourd’hui par le réseau et son intelligence collective, nous n’avions pas les moyens techniques de penser autrement ; nous aurions refait une Dewey...

J.-N. Jeanneney. Le coût du changement de classification dans une bibliothèque est considérable : cela exige la modification de toutes les cotes écrites sur les tranches des livres ! De ce point de vue, la bibliothèque numérique a un double avantage : l’argument matériel du coût de manipulation disparaît ; et elle offre les moyens techniques de faire évoluer les modes de classification existants, en occasionnant des rencontres inédites entre des disciplines jusque-là séparées. À nous d’en débattre et de nous en saisir.

Notes

[1NDLR : Quelques jours après cet entretien, Google Print était lancé. Une recherche « droits d’auteurs » ouvrait l’accès à 70 titres environs, à raison de trois pages par titre, mais aussi, à droite de la page, à une publicité pour un avocat parisien spécialisé dans la propriété littéraire et artistique.

[2Jean-Noël Jeanneney, Quand Google défie l’Europe, Mille & une nuits, 2005.

[3Melville Dewey, 1851-1931, bibliothécaire américain inventeur d’une classification décimale universelle utilisée dans la plupart des bibliothèques occidentales.