Titre
La bibliothèque numérique européenne : une stratégie culturelle de la toile
Auteurs
Valérie Tesnière dirige le Département de la coopération à
la Direction des services et des réseaux à la BnF.
Noémie Lesquins est archiviste-paléographe et conservateur de bibliothèque. Elle a commencé à la BnF comme chargé de mission pour les pôles associés, en particulier pour les bibliothèques du dépôt légal imprimeur.
Source
BBF 2006, Tome 51, n°3, pages 68 à 80
Sujet
Face au défi lancé par Google avec le projet « Google Print », J.P. Jeanneney, directeur de
la BnF, a impulsé un débat ouvert sur la stratégie culturelle du Web. En réaction, le président Jacques Chirac a émis l’idée d’une bibliothèque numérique européenne : «La BNUE », actuellement en projet.
Résumé
La BNUE étant un projet en réaction à l’évolution des moteurs de recherche, les deux auteurs de cet article montrent en premier temps comment les moteurs de recherche formatent les attentes du public.
Ils sont devenus indispensables sur Internet pour le repérage d’une masse d’information croissante. Seulement, leur stratégie est avant tout commerciale : augmenter leur popularité, accroître les flux d’information vers leur site, et faire du chiffre d’affaire (avec 85% de publicité). La presse quotidienne et les documents patrimoniaux sont devenus pour les moteurs de recherche, un enjeu majeur, dans la mesure où leur but est de maîtriser la chaîne des contenus en ligne pour avoir un maximum de parts de marché dans le domaine de l’information. Or, une étude du GESTE (Groupement des éditeurs de service en ligne) montre que Google News agrège les contenus de la presse internationale sans en citer la source. D’autre part, Google Print, un projet de numérisation de masse, n’a pas respecté les droits d’auteur au nom du Fair Use. Google a considéré que « tout ce qui n’était pas explicitement interdit était autorisé ». Ces contre-usages des documents sous droits pose la question de la sécurisation des données sur Internet. Dans la même mouvance, le consortium OCA (Open Content Alliance) -qui rassemble des entreprises informatiques (Yahoo, Adobe, Helwett Packard, MSN, Microsoft Archive), des bibliothèques, centres d’archives et éditeurs- souhaite développer un entrepôt numérique en ligne avec des données numériques de toute origine ; multimédia ; multilingues sur le principe de l’ « Open Content and Access ». Dans ce projet, chaque partenaire ajoute les contenus qu’il veut, au risque de multiplier les doublons ; et si, à la différence de Google, l’OCA respecte les droits de la propriété intellectuelle, son concept est trop ouvert pour que les éditeurs acceptent de s’y associer.
La BNUE ne refuse pas des partenariats opportuns avec les moteurs de recherche. En revanche, elle cherche à développer une stratégie culturelle du web différente. Selon les attentes conjointes des acteurs de la chaîne du livre et des internautes une réflexion est engagée pour offrir un outil grand public, utile à la recherche. Valérie Tesnière et Noémie Lesquins présentent la feuille de route qui a été proposée pour le moteur de recherche de
la BNUE en développant ses quatre aspects :
1- l’interface de localisation des textes
Pour fidéliser la clientèle, une interface commune à l’ensemble des fonds apparaît nécessaire. Les internautes sont sensibles à une visualisation unifiée des textes, et ne souhaitent pas être dépaysés par une navigation sur des sites différents. D’autre part, il est nécessaire de créer une présentation multilingue des instructions et des textes, pour permettre au plus grand nombre d’accéder au patrimoine culturel de l’Europe. A l’heure actuelle, les outils de traduction automatique posent certains problèmes au niveau technique, mais aussi sur un plan politique et juridique. Le premier objectif donné est de mettre en correspondance les textes numérisés avec les traductions libres de droits existantes.
2- la navigation intelligente de l’interface
Il s’agit d’apporter des résultats fiables, qui affichent les sources de classement et certifient l’origine de la source numérisée. Comme le web sémantique le permet aujourd’hui, le catalogue pourrait combiner une indexation humaine et un moteur de recherche en plein texte, qui offre une interrogation en langage naturel, avec un affichage intelligent des résultats et un élargissement des réponses aux domaines proches. C’est dans ce service que
la BNUE se distinguera des entrepôts numériques que gèrent les moteurs comme Google et Yahoo. De plus, ces outils pourront profiter aux éditeurs participants.
3- la gestion mutualisée des ayants droits
Les professionnels pensent qu’il est essentiel de développer une plateforme mutualisée de gestion, pour créer un espace d’accès aux contenus sous droits, moyennant rémunération, selon plusieurs modalités (à la consultation, par abonnement, téléchargement…), ainsi que des systèmes de sécurisation des documents diffusés et des paiements. Ces orientations pourraient s’accompagner de mesures qui encouragent les éditeurs à mettre en ligne des documents sous droits, dont la commercialisation ne serait pas à priori rentable (par ex. sous forme de réservoir accessible à toutes les institutions, géré par une société à laquelle il serait reversé les droits).
4- l’archivage numérique
Afin d’optimiser la conservation des collections, l’Union Européenne encourage l’utilisation de standards de description qui évitent la perte d’information lors des transferts de données, tout en facilitant la connexion avec des outils existants. Cet aspect est plus coûteux que la numérisation en elle-même. Il nécessite la normalisation de codages valables dans plusieurs pays. Les bibliothèques nationales ont une place importante à ce niveau, aux côtés des éditeurs, car elles peuvent s’engager plus durablement que le secteur privé.
C’est autour des compétences mutualisés des grandes institutions européennes pour développer ces services, et de la charte documentaire que se construira
la BNUE. Le fonds, à l’heure actuelle délimité, est uniquement textuel. Les 4 thématiques choisies s’orientent autour des fondements de l’identité européenne. Ils recouvrent volontairement des catégories documentaires appliquées aux sciences humaines et à l’édition de référence (incluant des supports comme les cartes et les dictionnaires), pour toucher un plus large public, mais il n’exclut pas la littérature générale. En un premier temps, ces axes permettent de définir la politique documentaire et éditoriale pour la numérisation et l’indexation, de manière à ce que
la BNUE se construise dans la concertation. D’ailleurs, les thèmes sont en adéquation avec les initiatives de numérisation de plusieurs pays européens (presse ancienne, classiques).
Seulement, le développement du programme rencontre quelques obstacles :- le seuil quantitatif : combien faudra-t-il de documents pour que le projet soit crédible ?
La BNUE impose une numérisation conséquente sur un délai limité. Or, la construction de la bibliothèque nécessite une mise à niveau de la production numérique, et les priorités sont différentes selon les pays.
La British Library vient tout juste d’avoir les subventions pour une numérisation de masse, alors que Gallica a déjà numérisé en mode image un fonds de 80000 documents ; mais qu’elle a l’obligation de le numériser à nouveau en OCR pour qu’il soit accessible en recherche en plein texte (N.B. le système de reconnaissance optique fonctionne mal sur les corpus du 16è – 18è siècles, et l’opération est coûteuse…). Ainsi, les avancées des plans de numérisation sont inégales selon les pays et il faut accorder un rythme de contribution adapté.
Les principaux partenaires de la BNUE sont les bibliothèques nationales européennes, les éditeurs européens volontaires, et les prestataires associés (moteurs de recherche, prestataires de numérisation, de recouvrements des droits…). Une fois ce projet réalisé la BNUE élargira peut-être ses contenus aux archives, multimédia et images. Mais pour le moment, beaucoup de réponses doivent encore être apportées. L’architecture de
la BNUE sera-t-elle centralisée ? Sa plateforme aura-t-elle des plateformes nationales complémentaires ? Qui seront les financeurs privés partenaires?Aujourd’hui, la BNUE doit encourager les réseaux de bibliothèques nationales qui sont les garants d’une harmonisation des pratiques, et prendre en compte les solutions diverses qui ont été adoptées par les pays de l’U.E. afin de créer des partenariats.
Avis Critique
Mon résumé est un peu long, mais l’article est assez complet et j’ai eu du mal à en extraire l’essentiel, sans aborder tous les points que j’ai donné.
J’ai réalisé cette fiche au moment ou nous avons reçu des informations nouvelles sur les avancées du programme de la BNUE. Je me suis donc rendue compte que certaines informations de cet article ne sont pas actualisées. En revanche, elles ne sont pas pour autant obsolètes. J’ai donc décidé de conserver cette fiche de lecture, car le contenu me semble enrichissant sur le thème de la construction d’une collection numérique. A travers l’exemple de la BNUE, on se rend compte que la construction d’une collection numérique s’intègre dans un contexte politique, économique et culturel qui n’est pas neutre. Construire une collection numérique c’est, d’une certaine manière, se positionner. A ce niveau l’article me rappelle les propos de J.C Guédon sur la bibliothèque virtuelle : en analysant l’histoire de l’imprimé d’un point de vue économique, il montre que toute évolution technique n’est pas étrangère au contexte dans lequel elle émerge, et qu’elle doit s’accompagner d’une politique documentaire cohérente pour que les concepts de la bibliothèque sur le web voient le jour (accès intellectuel à un contenu organisé, consultable à distance, valorisé…). A un moment où les contenus scientifiques et culturels sont devenus un enjeu pour les moteurs de recherche, il est nécessaire de développer une politique de l’Internet différente afin d’assurer la diversité culturelle sur la toile. D’autre part, la question de l’utilité d’une bibliothèque numérique se pose à travers les questionnements des acteurs de la BNUE : usages d’Internet ; besoins actuels en matière de recherche d’information ; conception de collections pérennes, qui s’adaptent à l’évolution des technologies (interopérabilité des systèmes, utilisations de standards de description) ; sélection de documents répondent aux manques sur Internet (face aux coûts de la numérisation, une collection n’est en effet peut-être pas utile si d’autres proposent déjà les mêmes contenus en ligne). D’une manière générale, je trouve que l’article a le mérite de montrer que la construction d’une collection est laborieuse : problèmes de temps, enjeux juridiques, difficulté d’harmonisation des pratiques et des savoirs dans le cadre de partenariats, contraintes de financements et interrogation face à l’évolution constante des techniques informatiques.
Archive de 13 décembre 2006
