Архів WWW

Submitted by Andriy Peleschyshyn on Wed, 27/10/2004 - 22:19

Може комусь це видасться банальним, але напишу пару слів про архів WWW.
Кілька раз за останній час стикався з тим, що навіть користувачі Інтернету зі стажем не знають про такий цікавий та корисний ресурс як http://www.archive.org - архів WWW.
На цьому сервері можна знайти старі копії сайтів. Сайти там представлені досить добре, в архів заносяться копії з інтервалом в кілька місяців.

Особливо корисним архів може бути в таких випадках

Підтвердження авторства матеріалів (точніше першості публікування в Інтернет)
Доступ до вже не існуючих сайтів чи сторінок.

Так, наприклад, за допомогою Веб-архіва можна доступитися до матеріалів уже неіснуючої україномовної бібліотеки "Чарівний жираф"

http://web.archive.org/web/20031224030926/http://tech77.hypermart.net/

У структурі посилання можна виділити оригінальну адресу сторінки. Правда по цій адресі сторінки може вже і не існувати (як це має місце у випадку зі "Жирафом" )

На частоту поповнення архіву сайту по моїх спостереженнях позитивно впливає його наявність в ODP (http://dmoz.org ).

Якщо ви не хочете бачити свій сайт у архіві, вам потрібно обмежити доступ до сайта роботу ia_archiver з сітки alexa.com . До речі, цей робот є одним з найактивніших інтернет-роботів. Деякі адміністратори блокують його за надмірну активність та відсутність безпосереднього стосунку до пошукових систем.

Про процедуру вилучення з архіву сайтів, які уже туди потрапили, мені не відомо нічого. Припускаю, що її не існує, адже вона суперечила би концепції архіву.

Andriy Peleschyshyn's blog

Журнал "Інформаційні технології. Аналітичні матеріали"

Тематика

Розділи

Партнер

Recent comments

Архів WWW

Реєстрація

Останні дописи

Новини у форматі RSS