Logo : Europeana. La contribution française à la bibliothèque numérique européenne

Le développement considérable qu'a connu internet a conduit à une croissance exponentielle du nombre d'internautes mais également du nombre de documents mis en ligne. Estimée à quelques centaines de milliers de textes accessibles au début du web, en 1993, la masse d'information numérique disponible sur le réseau dépassait les 900 millions de documents fin 2000 pour atteindre les 25 milliards de ressources en 2004. Grâce à internet, des milliers de documents littéraires et scientifiques, d'articles, de travaux universitaires et de recherche, d'images et de vidéos sont désormais consultables à l'écran, et le mouvement va en s'amplifiant : les internautes souhaitent de plus en plus consulter directement, à distance et gratuitement, les documents sous forme électronique. La tendance actuelle à la numérisation des fonds des bibliothèques répond à cette attente.
Internet bouleverse donc la production, la conservation et l'accès à l'information, au savoir et à la culture. Il est devenu, pour un grand nombre des citoyens, l'un des principaux moyens d'accès à la connaissance, à la communication et à la diffusion de l'information.

Qu’est-ce qu’une bibliothèque numérique ?

Une bibliothèque numérique, également appelée bibliothèque électronique ou bibliothèque virtuelle, est une collection organisée de documents électroniques en accès libre et généralement gratuit sur internet, associée à une interface permettant la recherche et la consultation de ces documents. Les bibliothèques numériques sont très variables en volume et en types de documents. Les ressources peuvent être des documents initialement produits dans un format numérique ou ayant suivi un processus de numérisation, il s'agit alors de copies numériques de documents physiques. Le web, bien qu'offrant un accès facile et rapide à des documents électroniques, ne peut être considéré comme une bibliothèque numérique, car il n'opère pas de sélection et de validation des contenus.

La première bibliothèque numérique est une initiative de Michael Hart, étudiant à l'Université de l'Illinois (Etats-Unis) qui, en juillet 1971, envisage de diffuser gratuitement sous forme électronique les œuvres littéraires du domaine public, à travers le Projet Gutenberg. Il numérise les ouvrages avec l'aide de volontaires afin de mettre la littérature à la disposition de tous, qu'ils soient familiarisés ou non avec le livre imprimé. Dans un premier temps, le Projet Gutenberg, basé aux Etats-Unis, est essentiellement anglophone. Mais en octobre 1997, Michael Hart annonce son intention d'intensifier la production de livres dans d'autres langues. En juin 2005, le nombre d'ouvrages numérisés s'élève à 16 000 et 42 langues sont représentées. En outre, en janvier 2004, le Projet Gutenberg Europe est créé. La présence de plusieurs langues reflète la diversité linguistique prévalant en Europe. En 2007, il compte 100 000 livres. Entreprise pionnière en la matière, le Projet Gutenberg a inspiré de nombreuses bibliothèques numériques.
Les bibliothèques numériques présentent certains avantages :
- elles constituent un outil de démocratisation de la culture en étant disponibles à tous, à distance. Elles permettent notamment à un large public d'avoir accès à des documents anciens ou rares, dont la consultation est très souvent difficile en raison des mesures de conservation de ces documents ;
- elles sont un moyen de préservation du patrimoine culturel mondial en permettant d'éviter aux documents les plus fragiles les dégradations d'un usage répété.
Grâce aux bibliothèques numériques, les bibliothèques traditionnelles peuvent rendre compatibles la conservation des documents et la communication de ceux-ci au grand public.
Néanmoins :
- la volatilité des supports numériques, qui ont une durée de vie restreinte, peut mettre en danger aussi bien que préserver les œuvres numérisées ;
- les œuvres numérisées sont soumises à la législation sur le droit d'auteur. Les bibliothèques numériques ont le droit de diffuser à titre gratuit uniquement les documents tombés dans le domaine public, c'est pourquoi elles sont généralement à vocation patrimoniale.

La Bibliothèque nationale de France : Gallica

Avec l'apparition du document numérique, les bibliothèques ont vu l'occasion de valoriser leurs collections en les mettant à disposition sur les réseaux. Ainsi, dans les années 90, de nombreuses bibliothèques, généralement des bibliothèques nationales ou spécialisées, ont commencé à numériser tout ou partie de leurs collections qui deviennent accessibles à distance.

Ainsi, la Bibliothèque nationale de France (BNF) inaugure, en 1997, Gallica, bibliothèque numérique à vocation patrimoniale et encyclopédique, couvrant de nombreuses disciplines (histoire, littérature, sciences, philosophie, droit, économie, sciences politiques). Dans un premier temps, Gallica propose des images et des textes du XIXème siècle francophone, à travers la numérisation de 3 000 livres. Un important programme d’"OCRisation" (permettant ensuite des recherches plein texte des documents) a été lancé en 2006, offrant à la consultation 90 000 ouvrages numérisés, 80 000 images et 500 documents sonores, allant du Moyen-Age au début du XXème siècle. Le 11 septembre 2007, un marché de dématérialisation "de masse" des collections de la BNF a été passé avec une société, portant sur la numérisation et la conversion en mode texte de 300 000 documents sur 3 ans. En 2010, la BNF sera en mesure de mettre à disposition sur Gallica2 près de 400 000 documents, simultanément en mode image et texte, soit plus de 45 millions de pages. Gallica constitue l’une des premières et des plus importantes bibliothèques numériques accessibles gratuitement sur internet.

Le projet Google Book Search

En octobre 2004, la société à l’origine du moteur de recherche Google annonce son projet de mise en ligne, sur internet, de plusieurs millions d’ouvrages numérisés. Initialement appelé Google Print, le programme Google Book Search comprend 2 volets articulés :

- tout d'abord, Google lance la numérisation d'ouvrages d'éditeurs commerciaux avec lesquels ont été signés des accords. Il propose de mettre en ligne des extraits d'ouvrages de façon à en assurer la promotion en vue de leur vente via des services de librairies en ligne ;
- et, en décembre 2004, l'entreprise prévoit de numériser à grande échelle les collections de 5 bibliothèques publiques anglo-saxonnes partenaires de l'opération (celle de la bibliothèque publique de New York et celles des Universités de Harvard, Stanford, du Michigan aux Etats-Unis et d'Oxford en Grande-Bretagne). Chaque bibliothèque dispose d'une version numérique des ouvrages, et Google en donne également l'accès de son côté. Il s'agit d'un projet de bibliothèque numérique de 15 millions de livres numérisés sur une durée totale de dix ans.
La version bêta de Google Print est mise en ligne en mai 2005. Cependant, en août 2005, Google Print est suspendu pour cause de conflit avec les éditeurs de livres soumis au droit d'auteur. En effet, la société californienne numérise des ouvrages qui ne sont pas encore tombés dans le domaine public car elle considère que l'utilisation qu'elle fait des ouvrages numérisés relève du "fair use" qui, aux Etats-Unis, accorde une exception aux droits exclusifs de l'auteur sur son œuvre (le copyright) en autorisant la consultation de documents sans permission préalable des ayants droits dans un certain nombre de situations. Le programme reprend en novembre 2005 sous le nouveau nom de Google Book Search. La numérisation des fonds de grandes bibliothèques se poursuit, axée cette fois sur les livres libres de droit, tout comme le développement de partenariats avec les éditeurs qui le souhaitent. Les ouvrages libres de droit sont consultables à l'écran en texte intégral, téléchargeables sous forme de fichiers PDF, et imprimables. En 2007, d'autres bibliothèques universitaires ont rejoint le programme dont la Bibliothèque cantonale et universitaire (BCU) de Lausanne (Suisse), pour la numérisation de 100 000 titres en français, allemand et italien, publiés entre le XVIIème et le XIXème siècle, qui seront consultables dans leur intégralité.
Les réactions

Le projet de Google, en raison de l’ampleur du volume d’ouvrages numérisés, des moyens dégagés et de la participation d’une entreprise privée à la mise en ligne de contenus patrimoniaux, a suscité des réactions et des oppositions vives. La première et la plus médiatisée fut celle de Jean-Noël Jeanneney, alors président de la Bibliothèque nationale de France (BNF).

L’objectif de ce dernier n'était pas d’arrêter le programme Google Book Search, mais de susciter une alternative européenne. Sa proposition reçoit, le 2 mai 2005, lors des " Rencontres pour l’Europe de la culture", l’appui du président français, Jacques Chirac, qui propose, dans son discours, la création d’une bibliothèque virtuelle européenne, ainsi que de 19 bibliothèques nationales européennes qui mettent en ligne, en mars 2005, le portail The European Library (TEL) permettant l’interrogation simultanée de leurs catalogues informatisés. Le 13 juillet 2005, le ministre français de la Culture met en place un "comité de pilotage en vue de la création d’une bibliothèque numérique européenne" et le 30 septembre 2005, la Commission européenne, publie la communication " i2010 : bibliothèques numériques" qui expose sa stratégie en matière de bibliothèques numériques européennes. Celle-ci vise à rendre le patrimoine écrit et audiovisuel de l’Europe disponible sur internet.

Les règles de la propriété intellectuelle en question

Google continuant de numériser des livres sous copyright sans l’autorisation préalable des éditeurs en invoquant le droit de citation ("fair use") pour présenter des extraits sur le web, le syndicat des auteurs américains, l’Author Guilde et l’Association des éditeurs américains (AAP) attaquent Google en justice pour non respect du copyright en septembre et octobre 2005. Les procès sont en cours et posent la question de l’assouplissement des lois sur la propriété intellectuelle, afin d’assurer un équilibre entre droit d’auteur et accessibilité. La Commission européenne, dans sa communication i2010 sur les bibliothèques numériques, souligne qu’il est indispensable, pour les projets de numérisation à grande échelle, d’assouplir les règles de propriété intellectuelle, faute de quoi il sera plus coûteux de rechercher les ayants droit que de réaliser le travail, point sur lequel le consensus est très large.

La bibliothèque numérique européenne (BNUE)

Au niveau européen, le projet de bibliothèque numérique européenne visant à ne pas laisser la diffusion du savoir sur internet aux entreprises privées et commerciales, souvent marquées par une influence anglo-saxonne dominante, comme Google Book Search, est officiellement lancé en mars 2006, suite à la remise du Livre blanc (résumé) [PDF, 360 Ko] du comité de pilotage français qui présente un plan d’action pour la BNUE. En effet, la Commission européenne annonce, le 2 mars 2006, dans un communiqué de presse, qu’elle va cofinancer la création d’un réseau paneuropéen de centres de numérisation et prévoit la numérisation de 2 millions de documents accessibles en ligne d’ici à 2008 et de 6 millions à la fin de 2010. Elle déclare également que cette bibliothèque européenne reposera sur l’infrastructure TEL (The European Library), portail internet multilingue, qui constitue une passerelle vers les catalogues des collections de plusieurs bibliothèques nationales. TEL devrait permettre l’accès aux collections numérisées de 47 bibliothèques nationales d’ici 2010.

Au niveau français, la Bibliothèque nationale de France, qui a reçu du gouvernement, le 2 mai 2006, la responsabilité officielle du pilotage opérationnel de la contribution française au projet, a réalisé le prototype Europeana qui donne accès, depuis le 22 mars 2007, à plus de 12 000 documents libres de droit issus des collections de la BNF et des bibliothèques nationales de Hongrie et du Portugal.

Ainsi, la bibliothèque numérique européenne prévoit de mettre gratuitement à disposition des contenus libres de droits et de mettre en place des modalités payantes de consultation pour les documents sous droits, dans le respect des droits des auteurs et des éditeurs. Elle présentera une collection organisée, encyclopédique et multilingue, constituée d’une sélection de documents qui sera réalisée par les personnels des bibliothèques nationales.

Les projets privés alternatifs à Google

Internet Archive : l’Open Content Alliance

L’Internet Archive, organisme à but non lucratif fondé en avril 1996, à San Francisco, par Brewster Kahle qui s’est fixé pour but d’archiver le web afin de préserver un historique d’internet pour les générations futures, considère que la mise à disposition de tous du patrimoine mondial ne doit pas être liée à des enjeux commerciaux. L’organisme s’associe donc, en janvier 2005, avec Yahoo! pour mettre en place l’Open Content Alliance (OCA), une initiative visant à créer un répertoire libre et multilingue de livres numérisés et de documents multimédias respectueux du copyright et interrogeable par n’importe quel moteur de recherche. L’OCA est lancée en octobre 2005 et rassemble des partenaires institutionnels (bibliothèques des universités de Californie et de Toronto, Archives nationales britanniques), des sociétés informatiques (Adobe, Hewlett Packard, Yahoo!, Microsoft) et des associations (Internet Archive, Research Library Group). Un site expérimental, l’Open Library, a été ouvert et propose de naviguer dans une sélection d’ouvrages numérisés issus des fonds de l’Université de Californie.

Microsoft : Live Search Books

Bien que Microsoft soit partenaire de l’Open Content Alliance, il a lancé, en décembre 2006, son propre service de consultation de documents numérisés en ligne, en réaction à Google Book Search qui n’autorise pas son interrogation par le moteur de recherche de Microsoft, Live Search. Live Search Books propose l'accès aux ouvrages libres de droits des collections de la British Library, de la New York Public Library et des bibliothèques des Universités de Californie, de Toronto et de Cornell, avec lesquelles Microsoft a passé des accords. La base de données a été intégrée au moteur de recherche et est donc interrogeable à partir de Live Search.

Vers une bibliothèque numérique mondiale

Le 1er décembre 2006, l’UNESCO et la Bibliothèque du Congrès des Etats-Unis ont organisé, à Paris, une réunion préparatoire au lancement d’une bibliothèque numérique mondiale (World Digital Library) conçue comme une banque de connaissances multiculturelles et multilingues sur internet. Des représentants de bibliothèques nationales d’Afrique, d’Asie, d’Europe, du Moyen-Orient, d’Amérique du Nord et d’Amérique du Sud ont participé à la réunion qui vise à mettre en place un réseau d’experts et de partenaires chargés de travailler sur le projet. L’objectif de ce programme est de promouvoir les échanges internationaux et interculturels, d’étendre le contenu non anglophone et non occidental disponible sur internet et de contribuer au développement du savoir.

D’après l’article de Jean-Michel Salaün, "Bibliothèques numériques et Google Book Search", Regards sur l’actualité n° 316, La Documentation française, décembre 2005.

Mis à jour le 03/11/2011

 

Autres contenus apparentés

Ressources complémentaires

Le centre de documentation

Un espace de consultation sur l'information légale et citoyenne.

Ouvert à tous, 29 Quai Voltaire, Paris 7ème

En savoir plus

[Publicité]