Архів WWW

Може комусь це видасться банальним, але напишу пару слів про архів WWW.
Кілька раз за останній час стикався з тим, що навіть користувачі Інтернету зі стажем не знають про такий цікавий та корисний ресурс як http://www.archive.org - архів WWW.
На цьому сервері можна знайти старі копії сайтів. Сайти там представлені досить добре, в архів заносяться копії з інтервалом в кілька місяців.


Особливо корисним архів може бути в таких випадках

  • Підтвердження авторства матеріалів (точніше першості публікування в Інтернет)
  • Доступ до вже не існуючих сайтів чи сторінок.


Так, наприклад, за допомогою Веб-архіва можна доступитися до матеріалів уже неіснуючої україномовної бібліотеки "Чарівний жираф"



http://web.archive.org/web/20031224030926/http://tech77.hypermart.net/



У структурі посилання можна виділити оригінальну адресу сторінки. Правда по цій адресі сторінки може вже і не існувати (як це має місце у випадку зі "Жирафом" )



На частоту поповнення архіву сайту по моїх спостереженнях позитивно впливає його наявність в ODP (http://dmoz.org ).



Якщо ви не хочете бачити свій сайт у архіві, вам потрібно обмежити доступ до сайта роботу ia_archiver з сітки alexa.com . До речі, цей робот є одним з найактивніших інтернет-роботів. Деякі адміністратори блокують його за надмірну активність та відсутність безпосереднього стосунку до пошукових систем.


Про процедуру вилучення з архіву сайтів, які уже туди потрапили, мені не відомо нічого. Припускаю, що її не існує, адже вона суперечила би концепції архіву.

© Інформаційні технології. Аналітика , Рідна Мережа