Canalblog
Editer l'article Suivre ce blog Administration + Créer mon blog
Publicité
Observatoire des libertés
12 mai 2007

Aspirateurs de sites

Article complet : http://www.vnunet.fr/fr/vnunet/news/2007/05/12/elys-e-2007-l-ina-sera-m-moire

L'institut national de l'Audiovisuel a pour mission d'archiver sites et blogs relatif à l'élection présidentielle.

80 millions d'URL, dont plus de 15 000 vidéos (hébergées pour près de 90% d'entre elles par Dailymotion). C'est le volume de liens et de documents Web que l'Institut national de l'audiovisuel (Ina) va conserver sur ses serveurs. Soit près de 700 Gigaoctets (Go) de stockage compressé et dédoublonné, dont plus de 300 Go pour les seules vidéos. Le tout dans un format spécifique de stockage (DAFF) développé par l'Ina.

Dans un communiqué de presse, l'INA décrit la méthodologie adoptée pour cette opération "aspirateur de la Web campagne" : l 'opération de collecte des sites a commencé le 26 janvier. Mais, depuis le mois d'avril, la fréquence d'aspiration s'est accélérée : les 500 principales pages de chaque site ont été collectées jusqu'à 4 fois par jour. Une collecte plus profonde a été menée tous les trois jours environ et une récupération plus complète a été effectuée chaque mois. 220 versions de chaque site auront ainsi été captées en moyenne, à différentes profondeurs, au cours de la campagne.

Publicité
Publicité
Commentaires
Observatoire des libertés
Publicité
Archives
  • 2007
Publicité