524 Archivage du Net par la Bibliothèque Nationale de France…
524 Archivage du Net par la Bibliothèque Nationale de France…
Quand on possède un site ou un blog sur Internet, ne croyez pas que vous pourriez y mettre n’importe quoi, n’importe comment et encore moins des choses illégales (même de les effacer rapidement...) car très régulièrement, une sauvegarde de nos «données» mises en ligne sur le Net à destination du public est faite régulièrement par les robots de la BNF (Bibliothèque Nationale de France) et cela sans vous en demander la permission, bien évidemment.
Depuis deux décennies, la Fondation Internet Archive, avec d’autres institutions nationales comme la BNF en France, consigne soigneusement la "mémoire du Web" par des sauvegardes sécurisées pour les générations futures.
Cette Bibliothèque Nationale de France (BNF) conserve en fait une trace de tout ce qui est déposé en quelque sorte en France sur Internet, donc enregistré sur la toile et lisible partout sur la planète de façon numérique. Ainsi, le travail mis en ligne sera donc conservé à jamais au même titre que l’INA (Institut National de l’Audiovisuel) fait également pour la postérité pour tout ce qui entre au domaine de l’audiovisuel cette fois (films, vidéos, documentaires, etc...). En plus, il est possible de consulter ces archives sur leurs sites.
Ce travail de fourmi n’est pas nouveau. Il a débuté aux Etats-Unis en 1996, pensé et réalisé par un américain (Brewster Kahle) soucieux de sauvegarder toutes les pages mise en ligne afin d’avoir «une trace éternelle» des travaux numérisés et de leur évolution au fil du temps. La France s’y est mise aussi plus récemment via la BNF.
Comment cela fonctionne-t-il...?
Il faut s’engouffrer dans les sous-sols de la Bibliothèque nationale François-Mitterrand pour y accéder. C’est ici dans ce «Data Center» monumental que repose l’histoire du Web français. Dans ces machines qui ne se reposent jamais (serveurs informatiques en action H24/J7), sont stockés 680 Téraoctets (To) d’archives, soit plus de 26 milliards de fichiers que la Bibliothèque Nationale de France (BNF) consigne soigneusement depuis vingt ans.
Comme les livres ou les journaux, le Web fait donc désormais lui aussi l’objet d’un archivage historique minutieux. Un site Web change, évolue ou disparaît d’après les spécialistes tous les quatre-vingts jours en moyenne. Et avec çà, c’est notre culture, notre histoire, la trace de nos vies qui disparaissent. Le Web a donc besoin d’une mémoire collective au même titre que nos livres d’antan, nos gravures, nos partitions de musiques ou nos dessins d’autrefois.
Les 680 To d’archives, auxquels s’ajoutent plus de 120 To de nouvelles données chaque année, sont conservés dans les locaux de la BNF, et une copie est stockée dans un autre lieu en France, dont l’emplacement est tenu secret. Vu les volumes, la rapidité de changement et la sécurité numérique, un futur troisième lieu sécurisé est déjà à l’étude.
Car vingt ans après les premiers pas de l’archivage, si d’énormes progrès ont déjà été faits, de nombreuses questions se posent encore sur la propriété intellectuelle par exemple. Le Web ne cesse d’évoluer, et la réglementation complique la tâche des archiveurs. En plus, tout ne peut pas l’être bien évidemment, il faut faire des choix. A l’image de l’arrivée des réseaux sociaux, par exemple, il est impossible d’archiver, tous les "tweets" existants. Et pour un travail de fond, de recherche ou d’inovation, quels sont les droits de leurs auteurs ou leur protection…?
A l’autre bout du monde, Brewster Kahle, quant à lui, rêvait «d’une bibliothèque mondiale, gratuite et accessible à tous et partout», une sorte d’encyclopédie universelle à l’image du Wikipédia, gratuite et accessible à tous ! «J’ai pour horizon l’année 2020, disait-il. J’aimerais d’ici là avoir pu la construire avec d’autres bibliothèques et institutions. Nous pourrions préserver nos collections dans un modèle décentralisé, comme ça si quelqu’un disparaît, la connaissance de ce qu’il a réalisé subsistera». Voilà comment Brewster kahle voyait la chose…en idéaliste d’avant-garde, certes, mais oh combien d’actualité et devenu nécessaire désormais.
Alors, comment voir les archives d'un site web ?
Ce «wayback», comme on le nomme pour retrouver une page disparue, ou une version ancienne d'un site Web…est très simple...:
- Accédez au site : www.waybackmachine.org*
- Indiquez l'URL du site que vous recherchez. ...
- Cliquer sur l'une des dates surlignées pour afficher la copie de la page à cette date.
- Naviguez dans les différentes versions depuis les flèches dans le haut de l'écran.
* Waybackmachine.org : Ce site nous annonce plus de 828 billions de pages sauvegardées à ce jour du 08 août 2023 !
J’ai vérifié pour mon site par exemple, il y a eu déjà à la date d'aujourd'hui -août 2023) 138 sauvegardes pour mon site. Cela donne 49 pages pour 2432 entrées d’articles, différentes & sauvegardées. Je peux donc y retrouver des articles (visibles sur la capture puisque mon site a été mis en ligne pour la toute première page en février 2006) que j’ai mis en ligne plus tard modifiés et/ou enlevés et/ou perdus ensuite pour X raison…! Et c'est ainsi que des sauvegardes ont été nombreuses depuis.
Ce qui veut dire aussi que si vous mettez en ligne un article non respecteux des conventions collectives usuelles (ou hors la loi), eh bien, on pourra toujours «le» et «vous» retrouver…
Comme dit le vieil adage…si vous mettez quelquechose sur la toile d’araignée mondiale…: «Souriez, vous êtes filmé» !
Voir la capture d’écran ci-dessous par exemple pour le cas de mon site ici et chaque capture ne représente qu’une petite partie de la page en question...
NB : Chaque barre de l’histogramme représente une sauvegarde d’effectuée depuis sa création en 2006 et la hauteur de cette barre indique l’importance (quantité nouvelle) de cette sauvegarde. Un calendrier placé en dessous permet également de voir le (les) jour exact et ainsi choisir la date précise de la sauvegarde à compulser.
Sur la dernère capture on peut voir par exemple que mon site contient sur une archive totale (pour le moment!) de 49 pages, pour un total de 2432 articles conservés «à jamais».
Qu'on se le dise et bon Surf sur le Net !
Inscrivez-vous au blog
Soyez prévenu par email des prochaines mises à jour
Rejoignez les 236 autres membres