Веб 2.0 та Семантичний Веб
ВЕБ 2.0 ТА СЕМАНТИЧНИЙ ВЕБ: ПОРІВНЯЛЬНИЙ АНАЛІЗ ПЕРСПЕКТИВНИХ ТЕНДЕНЦІЙ РОЗВИТКУ WWW
А.М. Пелещишин, О.Л. Березко
Вступ
Сьогодні Всесвітня павутина (World Wide Web) є безпрецендентним за своїми розмірами, багатоплановістю, динамічністю, доступністю, розподіленістю та темпами зростання обсягів контенту інформаційним ресурсом. Кількість користувачів Інтернету є надзвичайно великою (близько мільярда) і продовжує невпинно зростати.
Впродовж останніх років у розвитку Інтернету можна виділити ряд тенденцій, які стали визначальними. Їх підгрунтям є нові технології та підходи до розробки, підтримки, використання Веб-ресурсів, обміну інформацією між ними тощо. Ці підходи і технології отримали спільну назву “Веб 2.0” і позиціонуються багатьма дослідниками Вебу як новий якісний крок у розвитку Інтернету.
Разом з тим, вже довгий час існує інша концепція розвитку Вебу – Семантичний Веб, яка поки не отримала глобального успіху, але містить багато потенційно корисних ідей і є достатньо обгрунтованою теоретично. Основним завданням Семантичного Вебу є збагачення Веб-контенту мета-даними, які дозволять програмним агентам виконувати різноманітні складні пошукові завдання користувачів. Проте, певні цілі Семантичного Вебу вже сьогодні можуть бути ефективно досягнуті засобами Вебу 2.0. З огляду на це актуальним є порівняльний аналіз цих концепцій.
У статті пропонується комплексний аналіз концепції Вебу 2.0 та співставлення її з Семантичним Вебом.
1. Веб 2.0 (Web 2.0)
Поняття “Веб 2.0” з’явилося у 2004 році і отримало велику популярність (близько 874 мільйонів посилань у Google станом на липень 2006 року). Проте, досі триває дискусія про те, що саме воно означає, і чи є насправді важливим.
Як правило, при поясненні поняття “Веб 2.0”, експерти в галузі Вебу не дають чіткого визначення, а окреслюють певну множину положень, часто використовуючи діаграми та інші засоби візуалізації. Це свідчить як про нечіткість цього поняття, так і про динамічність його розвитку (додавання нових положень та трансформація існуючих). Аналізуючи найбільш цитовані статті, присвячені цьому питанню (згідно з результатами Google та рекомендаціями тематичних Веб-сайтів), а також Веб-ресурси, які вважаються носіями відповідних тенденцій, можна виділити ряд основних положень Вебу 2.0 (варто зауважити, що положення розміщені не в порядку спадання важливості, а з метою дотримання логіки викладення матеріалу; найважливішим пунктом цього списку є “демократія”):
1.1 Мобільність інформації
Веб 2.0 характеризується мобільністю інформації. Це означає можливість публікування одного елементу контенту на різних Веб-ресурсах. Така можливість є вигідною як для сайту, що надає інформацію (тиражування свого контенту на необмеженій кількості Веб-ресурсів, яке призводить до зростання трафіку цього сайту і є простою у застосуванні і ефективною формою реклами), так і для сайту, що одержує та публікує її (одержання останніх новин та іншого актуального контенту, можливість комбінування різних джерел інформації, що підвищує популярність сайту).
Іншим проявом мобільності інформації є подкастинг (podcasting) – поширення аудіо- та відеофайлів через Інтернет. Основною відмінністю подкастингу від трансляції є те, що користувач сам обирає об’єкт (конкретний файл), час та місце його прослуховування або перегляду (передбачено застосування портативних пристроїв).
Мобільність інформації є однією з основ демократії (описана нижче).
Засобами мобільності інформації є:
• застосування технології синдикації Веб-контенту (канали новин)
Канали новин (feeds) набули широкого поширення у Вебі, виконуючи роль “живих” зв’язків між Веб-ресурсами, які не прив’язуються до конкретної Веб-сторінки або іншого елементу Веб-контенту, а дозволяють користувачу отримувати лише новий контент певного сайту чи його частини. Велика кількість Веб-ресурсів пропонує користувачам широкий вибір таких каналів (наприклад, на форумах існують виділені канали новин для кожного розділу, теми обговорення тощо). Часто за допомогою каналу новин передається не вся стаття, а лише її резюме з посиланням на повну версію та необхідними метаданими.
Користувачі можуть збирати довільну кількість каналів новин в одному місці за допомогою спеціалізованих додатків (feed-агрегаторів). Прикладом on-line feed-агрегаторів є “стартові сторінки” – Веб-ресурси, які виконують роль стартової точки сеансу навігації користувача у Вебі. Окрім функції відображення останніх новин з обраних користувачем Веб-ресурсів, багато з них інтегрують інші функції: редагування тексту (інтеграція з on-line редакторами writely.com, zohowriter.com тощо), робота з поштовою скринькою (інтеграція з поштовим сервісом gmail.com) тощо. Сьогодні найбільш популярними “стартовими сторінками” є: netvibes.com, pageflakes.com, linkedfeed.com, protopage.com, start.com.
Засобами синдикації Веб-контенту є ряд спеціальних форматів даних, основою яких є мова XML. Популярність на сьогодні здобули формати RSS (Rich Site Summary, Really Simple Syndication або RDF Site Summary – в залежності від версії) та Atom.
• гнучкий підхід до авторських прав (ліцензування Creative Commons)
Ліцензії, які пропонує проект Creative Commons (creativecommons.org) дозволяють власникам авторських прав на Веб-контент надавати частину цих прав Веб-спільноті з метою уникнення проблем з чинним законодавством, які можуть виникнути при поширенні інформації у Вебі.
1.2 Гнучкість Веб-додатків
• гнучкість експлуатації: інтерактивність на рівні ПК-додатків (rich user experiences)
Основою багатьох Веб 2.0 додатків (gmail.com, maps.google.com, netvibes.com, flickr.com, тощо) став AJAX (Asynchronous JavaScript And XML) – сукупність технологій, які були об’єднані за допомогою Java Script:
- використання стандартів XHTML та CSS для презентації даних;
- забезпечення динамічності та інтерактивності за допомогою DOM (Document Object Model);
- маніпуляція даними у форматі XML та XSLT;
- асинхронні запити за допомогою XMLHttpRequest.
Можливість робити запити до сервера без перезавантаження сторінки та працювати з XML-документами дозволили впритул наблизити інтерактивність Веб-додатків до “звичайних“ ПК-додатків (швидка реакція на дії користувача, використання принципу drug-and-drop тощо).
Підвищена інтерактивність робить взаємодію користувача з Веб-сайтом більш інтенсивною, зручною і сприяє залученню нових користувачів.
• гнучкість поєднання: mashups
Сьогодні велика кількість Веб-ресурсів (www.google.com, www.yahoo.com, flickr.com, www.amazon.com та багато інших) пропонують користувачам власні API (Application Programming Interface), які дозволяють використовувати можливості цих ресурсів у розробках користувачів.
Для Веб 2.0 характерним є створення нових Веб-ресурсів за допомогою поєднання можливостей кількох вже існуючих (mashups). Одним з найбільш вдалих таких поєднань є www.housingmaps.com (накладання інформації про ціну купівлі та аренди нерухомості з www.craigslist.com на карти maps.google.com).
1.3 Демократія (орієнтованість на користувача)
Веб 2.0 характеризується стрімким зростанням активності користувачів, що викликано:
- доступністю Інтернету для широких верств населення;
- можливістю створювати Веб-контент та розміщувати посилання у Вебі маючи мінімальні навики користування комп’ютером, робити це просто і швидко.
Для Вебу 2.0 визначальною є висока активність користувачів, пов’язана з досягненням креативних та комунікативних цілей у Вебі, прикладами якої є:
• участь у різноманітних віртуальних спільнотах
На сьогодні у Вебі однією з найпопулярніших форм віртуальних спільнот є форум.
На форумах у повній мірі досягаються комунікативні цілі користувачів. Обговорення певної теми відбувається засобами додавання повідомлень, які можуть містити текст, зображення, посилання тощо. Контент (а часто і тематика) форумів залежить виключно від користувачів.
Як правило, кожен форум має модератора (модераторів) – особу, яка здійснює контроль за перебігом обговорення і, при потребі, корегує його, додаючи необхідні коментарі та видаляючи повідомлення, які:
- є образливими для інших учасників форуму, провокують конфлікт (флейм);
- не стосуються теми обговорення (офтоп);
- не мають змістовного наповнення (флуд);
- містять відкриту рекламу в некоректній формі (спам).
Проте нав’язливе регулювання спільноти форуму (нав’язування тем обговорень, власної точки зору модератора, адміністратора чи власника; необгрунтоване вилучення учасників форуму та їх повідомлень тощо) є не лише беззмістовним, але й шкідливим, оскільки такі дії руйнують аудиторію форуму (фактично сам форум, який не може ефективно функціонувати без аудиторії).
Натомість деяким чином контролювати чи скеровувати в певному напрямку спільноту форуму, пропагувати певну точку зору тощо можуть авторитетні користувачі. Мірою авторитетності є, як правило, кількість дописів, їхня якість, адекватність тощо. Деякі форуми та інші віртуальні спільноти пропонують користувачам механізм оцінювання якості конкретного допису та корисності конкретного користувача для віртуальної спільноти. Оцінка конкретного користувача спільнотою форуму (“карма”) може бути як додатньою, так і від’ємною і впливає на права користувача у віртуальній спільноті.
Іншим важливим видом віртуальних спільнот є комерційні Веб-спільноти, зокрема інтернет-аукціони, найуспішнішим з яких на сьогодні є eBay (www.ebay.com), та ті інтернет-магазини, які активно співпрацюють з користувачами, створюючи власні спільноти, як, наприклад, Amazon (www.amazon.com).
Інтернет-аукціон eBay, подібно до форумів, повністю залежить від користувачів, які можуть виступати в ролі продавця і покупця. Користувач у кожній з цих ролей може підвищувати свій авторитет (репутацію) шляхом проведення успішних транзакцій (актів купівлі/продажу). Авторитетність користувача є визначальною при виборі партнера для проведення наступної транзакції і дозволяє вести більш жорстку цінову політику. За таких умов роль самого сервісу зводиться до посередництва між продавцем і покупцем та забезпечення зручних та безпечних умов для торгівлі.
eBay якісно відрізняється від своїх конкурентів лише одним – величезною (критичною) кількістю користувачів. Аудиторія eBay є його найважливішою складовою і автоматично робить будь-який ресурс, що пропонує аналогічні послуги, значно менш привабливим.
Інтернет-магазин Amazon пропонує ті ж товари, що і конкуренти, але значно випереджає їх за об’ємом продаж. Причина цього – у активному залученні користувачів до коментування, обговорення товарів тощо. Запрошення долучитись (висловити свою думку) присутні на переважній більшості Веб-сторінок цього ресурсу. Більше того: Amazon використовує активність користувачів для покращення результатів пошуку. Такий підхід дозволяє пропонувати користувачам товари, не лише релевантні їх запитам, але й найбільш популярні.
• ведення персональних або спільних Веб-журналів (блогів)
Стрімке зростання кількості блогів, кількості дописів у них та інформаційних зв’язків між блогами – одна з визначальних рис Вебу 2.0.
Блог (Web log, blog) – це Веб-сайт журнального типу, який дозволяє обмеженому колу користувачів (найчастіше це одна особа) розміщувати там свої дописи і надає читачам можливість коментувати кожен допис. Блоги ефективно задовільняють потребу людини до самовираження, публічного висловлення власної точки зору, спілкування з людьми з подібними інтересами.
Згідно з slashdot.org блоги є “…новою, персональною і дружньою за визначенням еволюцією електронної спільноти. Вони є також найсвіжішим прикладом використання Мережі людьми для створення своїх власних, радикально інших нових засобів масової інформації”.
Блоги прийшли на зміну персональним Веб-сторінкам, від яких вони якісно відрізняються:
- хронологічною організацією;
- простотою додавання та коментування нового контенту;
- можливістю “підписатись” на блог (автоматично одержувати нові дописи блогу) за допомогою технології RSS, Atom тощо;
- наявністю пермалінків (“жорстких” посилань на кожний конкретний допис).
Блог дозволяє користувачу зосередитись на створенні нового контенту, не заглиблюючись в технічні проблеми його публікації.
Стрімке поширення блогів почалося у 1999 році, чому сприяло створення таких інтегрованих середовищ як LiveJournal (www.livejournal.com), Blogger (www.blogger.com) тощо, де користувач має можливість безкоштовно створити свій блог, виконавши просту послідовність дій. На сьогодні у Вебі є десятки міліонів блогів і їх кількість постійно зростає.
Технологія RSS та пермалінки створили передумови для виникнення явища, яке отримало назву “блогосфера”. Блогосфера (Blogosphere, Blogspace) – це глобальна сукупність блогів, яка характеризується величезною кількістю зв’язків між своїми елементами і може розглядатися як соціальна мережа (social network). Блогосфері притаманне регулярне додавання нового унікального авторського контенту (написаного переважно у неформальній манері) та ведення дискусій, які охоплюють різні за розміром та тематикою частини блогосфери.
Розвитку блогосфери сприяє також механізм “трекбеків” (trackback), “зворотніх” посилань, які демонструють читачу блогу, які Веб-ресурси посилаються на даний допис.
Сьогодні блогосфера все частіше виграє конкуренцію з платними он-лайн виданнями. Навіть при бажанні користувача заплатити за доступ до певної Веб-сторінки, він не зможе посилатись на неї, тим самим унеможливлюючи обговорення серед широких мас, що негативно впливає на популярність платного ресурсу.
Серед дослідників Вебу набуло поширення поняття “довгий хвіст” (“the long tail”), введене Крісом Андерсоном, яке означає принцип за яким велика кількість невеликих ринків збуту є рівноцінною або навіть більш вартісною, ніж вузьке коло великих ринків. У випадку Вебу це означає величезну сукупність невеликих сайтів, які на сьогодні продукують значну (якщо не переважну) частину контенту, і протиставляються “голові” чи “центру” Вебу – відносно невеликій кількості потужних Веб-ресурсів.
Протягом останніх років широкої популярності набула програма Google AdSence – безкоштовний сервіс, який дозволяє Веб-сайтам надавати частини своїх Веб-сторінок для рекламних вставок у вигляді посилань на певні Веб-ресурси з невеликими коментарями. Посилання обираються окремо для кожного Веб-сайту в залежності від його контенту, що дозволяє більш ефективно залучати цільову аудиторію. Власник сайту одержує гроші кожного разу, коли відвідувач здійснює перехід по рекламному посиланню. Аналогічні програми почали з’являтися і на інших Веб-ресурсах: наприклад, Ads by Yahoo! – частина платформи Yahoo! Publisher Network. Такий підхід до реклами є більш дружнім для користувача ніж баннери та “вспливаюча” реклама і дозволяє заробляти гроші невеликим Веб-сайтам “довгого хвоста”.
Стрімке збільшення масштабів блогосфери, зокрема її Веб-контенту, спричинило виникнення спеціалізованих пошукових систем (“фільтрів блогів”), які дозволяють здійснювати більш ефективний пошук у блогосфері: technorati.com, memeorandum.com, bloglines.com, findory.com, topix.net, blogniscient.com, tailrank.com тощо.
Сьогодні поширення набуває новий тип блогів – влоги (відео блоги), засновані на технології подкастинг, де роль дописів відіграють відеофайли.
• розміщення коментарів у Вебі
Сьогодні велика кількість Веб-ресурсів надає користувачам можливість коментувати елементи свого контенту. Найбільшого поширення коментування набуло у блогосфері та інтернет-магазинах.
Механізм швидкого додавання коментарів у блогах створює сприятливі умови для ведення дискусій, тим самим наближаючи блог до форуму. Часто коментарі на допис є значно цікавішими для читачів блогу, ніж сам допис.
В інтернет-магазинах коментарі забезпечують зв’язок з користувачами (покупцями) для моніторингу популярності товарів тощо.
• розміщення посилань у Вебі
Сьогодні розміщення посилань у Вебі користувачами є однією з найважливіших причин стрімкої розбудови структури Вебу.
Розміщення посилань є простим як і розміщення контенту. Користувачі можуть розміщувати посилання на форумах, у блогах, коментарях тощо. Посилання дає можливість користувачу цитувати чужий контент, що часто використовується в дискусіях та анонсах цікавих користувачу Веб-ресурсів (характерно для блогосфери).
Все більшої популярності набуває новий вид Веб-ресурсів: колекції “закладок” – посилань на цікаві користувачу Веб-ресурси (social bookmarking). Власне, ідея “закладок” не є новою: аналогічні колекції можна створювати засобами сучасних браузерів.
Основними відмінностями он-лайн колекцій “закладок” є:
- можливість користувача отримати доступ до своїх закладок звідки завгодно (“закладки” у браузері прив’язані до конкретного комп’ютера);
- можливість надавати доступ до своєї колекції іншим користувачам та використовувати чужі колекції.
На сьогодні найбільш популярними Веб-ресурсами, які дозволяють користувачу створювати колекції “закладок” є: del.icio.us, blinklist.com, shadows.com, clipmarks.com, stumbleupon.com. Цей тип Веб-ресурсу є, фактично, видом віртуальної спільноти, для успішного функціонування якого визначальним є розмір активної аудиторії.
Колекції “закладок” виконують ще одну важливу функцію – створюють середовище для голосування. Кожного разу, коли користувач додає до своєї колекції нове посилання на певний Веб-ресурс та довільним чином коментує його, він, фактично, голосує за нього. Це дає можливість аналізувати популярність ресурсів, покращувати результати пошуку тощо. Така форма он-лайн голосування дозволяє говорити про так званий HumanRank (неформальну оцінку Веб-ресурсу активними користувачами сервісів “закладок”) на противагу PageRank – алгоритму, за яким ранжує результати пошуку найпопулярніша на сьогодні глобальна пошукова система Google.
Внаслідок цього он-лайн колекції “закладок” вперше створили реальну альтернативу глобальним пошуковим системам (Google, Yahoo! тощо). Користувачу досить здійснити пошук на такому сервісі, або просто знайти користувача цього сервісу з інтересами, подібними до своїх, і проглянути його колекцію, або підписатися на одержання його нових “закладок” (наприклад, за допомогою технології RSS), щоб отримати посилання на Веб-ресурси, які його цікавлять.
• опис Веб-контенту за допомогою тегів
Набуває все більшого поширення нова форма коментування (опису) Веб-контенту – теги.
Тег (tag) – це слово, яке вільно обирається користувачем для опису Веб-ресурсу, зображення тощо. Кожен такий об’єкт може бути описаний довільною кількістю тегів, які виконують функцію метаданих.
Механізм присвоєння тегів дозволяє користувачам здійснювати спільну категоризацію Веб-контенту. Утворені категорії є гнучкими, асоціативними, перекриваються одне з одним і є природними для людини. Такий підхід до категоризації отримав назву “фолксономія” (folksonomy)на противагу ієрархічному підходу, який застосовується, наприклад, у файлових системах – таксономії (taxonomy). Для ефективного застосування фолксономії важливою є велика активна аудиторія Веб-ресурсу.
Вперше механізм присвоєння тегів був реалізований на Веб-сервісах del.icio.us та www.flickr.com. У класичному прикладі його застосування зображення песика, збережене на www.flickr.com, може бути описане тегами “цуценя” і “милий”.
• публікування іншого контенту у Вебі
Протягом останніх років у Вебі з’явилася велика кількість сервісів, які дозволяють користувачу публікувати дуже різний за своєю структурою та тематикою контент.
Серед найбільш помітних категорій таких Веб-ресурсів можна виділити наступні:
- сайти новин, що додаються користувачами на рівних правах (peer production news)
Ідея таких сайтів полягає у додаванні новин користувачами та голосуванні за них. Веб-ресурси такого типу є надзвичайно популярними, оскільки неважливі або нецікаві новини відфільтровуються аудиторією ресурсу, і користувач отримує найбільш важливу і цінну інформацію. Пол Грехем порівнює такі Веб-сайти з “RSS-каналом до всього Вебу з фільтром якості”.
Найбільш популярними Веб-ресурсами у цій категорії є: digg.com, newsvine.com, diggdot.us, gabbr.com, reddit.com. Варто зазначити, що великою популярністю користуютсься також RSS-канали цих ресурсів. Зокрема, RSS-канал digg.com вважається одним з найпопулярніших у Вебі.
- Веб-ресурси, які пропонують он-лайн зберігання та спільне використання зображень
Сайти такого типу дозволяють користувачам публікувати зображення, здійснювати їх спільну категоризацію за принципом фолксономії та виконувати інші дії. Найбільш популярними Веб-ресурсами у цій категорії є: flickr.com (піонер фолксономії), zoto.com, slide.com, glidedigital.com, shutterbook.com.
• редагування Веб-контенту, створеного іншими користувачами.
Впродовж останніх років набув популярності новий тип Веб-ресурсу, який отримав назву вікі (wiki).
Механізм вікі був винайдений у 1995 році Вардом Канінгемом (Ward Cunningham) і дозволяє користувачам вільно створювати та редагувати контент Веб-сторінки, використовуючи довільний браузер. Редагування контенту користувачами може бути здійснене просто і швидко, часто навіть без реєстрації на вікі-ресурсі. Для редагування елементу контенту, користувачу достатньо перейти по відповідному посиланню (запрошення редагувати усю статтю, окремий абзац тощо), відредагувати текст запропонованими засобами та підтвердити зміни. Введений текст перетворюється на HTML-код засобами вікі. Така легкість взаємодії користувачів перетворює вікі на ефективний засіб спільного написання тексту, автором якого можна вважати всю аудиторію користувачів ресурсу.
Іншою важливою рисою вікі є контроль за версіями статті в процесі її спільного редагування користувачами. Оскільки кожен користувач може вносити довільні зміни до довільної статті вікі, актуальною є проблема “поганих” користувачів, які з різних причин здійснюють внесення невірної, образливої та іншої некоректної інформації у статті, знищують коректні дописи тощо.
Засобами протидії таким користувачам є зокрема:
- Веб-сторінки “останніх внесених змін” (Recent Changes) – історія змін, внесених у статтю користувачами за певний часовий проміжок;
- збережені попередні версії статей (Revision History) та функція diff, яка демонструє відмінності між версіями;
- автоматичне відфільтровування змін, які суттєво зменшують розмір статті; змін, які автоматично здійснюються програмними агентами тощо.
Сьогодні найуспішнішим вікі-проектом є Вікіпедія (wikipedia.org) – “вільна енциклопедія”. Цей багатомовний Веб-проект дозволяє користувачам створювати статті на теми з будь-якої галузі знань, редагувати вже існуючі статті, просити про створення статті на певну тему тощо. Про популярність підходу вікі до створення Веб-контенту та Вікіпедії зокрема свідчить статистика цього ресурсу: станом на липень 2006 року Вікіпедія містить більше 4600000 статей на різних мовах (з них більше 1200000 – на англійській) і ці цифри невпинно зростають.
1.4 Веб як платформа
Сучасний Веб еволюціонував у платформу, яка об’єднує всі сполучені пристрої. Клієнтом Веб 2.0 - додатку може бути: звичайний браузер; програма, що працює у фоновому режимі; feed-агрегатор; додатки, встановлені на мобільні пристрої тощо.
Веб 2.0 може розглядатися як платформа для розробників програмного забезпечення (використання API Веб-додатків для створення нових програмних продуктів тощо).
Веб 2.0 – це також і платформа для користувача, яка дозволяє йому здійснювати різноманітну діяльність on-line, використовуючи лише браузер: працювати з текстом, електронними таблицями, e-mail, зображеннями, звуком та відео; зберігати файли; працювати спільно з іншими користувачами; отримувати новини тощо.
2. Семантичний Веб (Semantic Web)
Сьогодні через величезні розміри, невпорядкованість та слабоструктурованість Веб-контенту результати пошуку необхідної інформації у Вебі засобами глобальних пошукових системи не завжди можна вважати задовільними і такий пошук часто вимагає значних витрат часу користувача. Разом з цим, створення ефективних автоматичних пошукових засобів ускладнюється тим, що Веб був створений для опрацювання людьми, а не програмними агентами (структура Вебу, зокрема HTML-код Веб-сторінок, має дуже обмежені засоби класифікації частин контенту, хоча дозволяє здійснювати його багате візуальне представлення).
“Семантичний Веб” (“Semantic Web”) – термін, введений винахідником Вебу Тімом Бернерсом-Лі (Tim Berners-Lee). Семантика – це вивчення значень. Семантичний Веб – це підхід до розвитку Вебу, який полягає у збагаченні Веб-контенту спеціалізованими мета-даними і створенні засобів для автоматичної обробки цих мета-даних (інтелектуальних програмних агентів), які могли б розпізнавати значення документів з метою виконання складних пошукових завдань користувачів.
Сьогодні Семантичний Веб представлений наступними технологіями:
• глобальна схема імен – URI (Uniform Resource Identifier)
URI – це уніфікований ідентифікатор ресурсів у Вебі. Будь-який елемент контенту, що має URI вважається “присутнім у Вебі”. Кожний об’єкт даних та кожна схема/модель даних у Семантичному Вебі повинна мати власний URI.
• стандартний синтаксис для опису даних – RDF (Resource Description Framework)
RDF (діалект XML) – це специфікація, яка визначає модель для представлення світу і синтаксис для зміни цієї моделі. RDF забезпечує стандартизований підхід до опису різноманітних Веб-ресурсів (Веб-сторінок, зображень, аудіо- та відеофайлів тощо) і є базовою мовою розмітки для Семантичного Вебу, яка визначає напрямлений граф відношень. Такий граф представлений трійкою “об’єкт-атрибут-значення” (об’єкт A має атрибут B зі значенням C). Альтернативою RDF XML є Notation3.
• стандартний засіб опису властивостей даних – RDF Schema
RDF Schema – це семантичне розширення RDF, яке забезпечує механізм для опису груп зв’язаних ресурсів та зв’язків всередині цих груп.
• стандартний засіб опису зв’язків між об’єктами даних – онтології, описані за допомогою OWL Web Ontology Language
Синтаксична взаємодія полягає у коректному синтаксичному аналізі даних і вимагає побудови відповідностей між термінами, яка в свою чергу вимагає аналізу контенту.
Аналіз контенту вимагає формальних явно заданих специфікацій моделей доменів, які визначають використані терміни та зв’язки між ними. Такі моделі доменів називають онтологіями (ontologies). Онтології визначають моделі даних у термінах класів, підкласів та властивостей.
Саме для вираження онтологій і була створена мова OWL (Ontology Working Language). OWL має більше засобів для опису класів і властивостей, ніж RDF та RDF Schema, зокрема можливість опису зв’язків між класами, кількості елементів тощо.
OWL призначений для використання додатками, метою яких буде опрацювання Веб-контенту, і сприяє наданню Веб-контенту ширших можливостей бути інтерпретованим цими додатками.
• стандартна мова запитів до даних у форматі RDF – SPARQL (рекурсивно: SPARQL Protocol and RDF Query Language)
Мова запитів SPARQL дозволяє видобувати інформацію з графів RDF. Вона надає засоби для:
- видобування інформації у формі: URI, порожніх вершин графу, типізованих або нетипізованих літералів;
- видобування підграфів RDF;
- створення нових графів RDF, заснованих на інформації з графів, до яких здійснювалися запити.
Як мова запитів, SPARQL дозволяє працювати як з локальними, так і віддаленими даними.
3. Підсумки: Веб 2.0 та Семантичний Веб
3.1. “Веб для людей”
Веб 2.0 – це “Веб для людей”. Причина успіху концепції Вебу 2.0 у простоті. Саме простота та зручність використання Веб-ресурсів забезпечили флагманам Вебу 2.0 великі активні аудиторії користувачів, які, в свою чергу, вдосконалюють ці ресурси. Глобальна Веб-спільнота застосовує колективний інтелект у Вікіпедії, блогосфері, колекціях “закладок” тощо.
Проте, участь великих мас людей та абсолютна свобода слова породжує слабке місце Вебу 2.0 – “культ аматора” (“анти-елітність”), яке проявляється насамперед у Вікіпедії та блогосфері. Прикладами цього є:
- висловлення думки людьми, недостатньо компетентними в тому, про що вони пишуть – джерело неточної, неповної та поверхової інформації;
- домінування точки зору конкретного дописувача над фактами;
- присутність ідеологічного екстремізму;
- недбалість дописувачів (результат відсутності необхідності “відшліфовувати” текст).
У зв’язку з цим, блогосферу та Вікіпедію не завжди можна розглядати як достовірне повноцінне джерело даних, хоча корисність їх для початкового ознайомлення з темою та пошуку інших матеріалів по темі безсумнівна. Занепокоєння викликає також те, що через задовільну (достатню) якість та безкоштовність такі дописи можуть з часом витіснити високоякісні платні професійні статті, що негативно відобразиться на якості контенту усього Вебу (прикладом такого витіснення є протистояння Вікіпедії та платної on-line енциклопедії Britannica, яке розгортається не на користь останньої).
Неоднозначним місцем концепції Вебу 2.0 є також застосування колективного інтелекту (наприклад, при спільному редагуванні тексту), іншою стороною якого є нав’язування точки зору більшості конкретному користувачу. Очевидно, що Веб все більше набуває ознак реальної глобальної спільноти.
Отже, попри недоліки, Веб 2.0 є сукупністю тих тенденцій, які сьогодні формують обличчя Вебу і будуть робити це надалі, все більше вдосконалюючись. Запорукою цього є комерційний успіх проектів Веб 2.0 та постійне зростання кількості користувачів Вебу.
3.2. “Веб для машин”
Семантичний Веб – це “Веб для машин”, повноцінна реалізація ідеї якого дозволила б не лише здійснювати надефективний комплексний пошук за допомогою інтелектуальних програмних агентів, а й знаходити приховані закономірності у масштабних розподілених наборах даних, допомагати відслідковувати активність організованої злочинності та терористів, сприяти аналізу розподілених геологічних та метеорологічних даних, допомагати у розподілі та повторному використанні важливих освітніх ресурсів тощо.
Проте, сьогодні ця концепція розвитку Вебу не має повноцінної мейнстрімової реалізації. Серед причин цього можна виділити наступні:
- Відсутність мотивації розробників. Необхідною умовою впровадження Семантичного Вебу є наявність критичної кількості Веб-ресурсів з коректними метаданими у відповідних форматах. Створення таких метаданих лежить на плечах розробників Веб-сайтів і є відносно складною задачею, яка не буде виправдана (зокрема фінансово) доти, доки Семантичний Веб не почне працювати на повну потужність. Виходить замкнуте коло.
- Неможливість гарантувати достовірність метаданих. Семантичний Веб надає широкі можливості для опису даних та зв’язків між ними, а отже і широкі можливості для здійснення цього некоректно, як зумисно, так і помилково. Наприклад, створення завідомо неправильних метаданих може стати ефективним засобом пошукового спаму.
- Засоби Семантичного Вебу є відносно складними. Із двох приблизно однаково ефективних підходів перевагу завжди отримує більш простий. Прикладом цього є те, що формат RSS 1.0, заснований на RDF, є значно менш популярним, ніж простіший RSS 2.0.
Отже, впровадження принципів Семантичного Вебу є бажаним, проте з багатьох причин на сьогодні у повній мірі не здійснене.
3.3. Семантичний Веб 2.0
Цілі Веб 2.0 і Семантичного Вебу багато в чому співпадають, але досягаються різними засобами і з різною ефективністю. Наприклад, опис даних з метою покращення їх пошуку здійснюється у Вебі 2.0 за допомогою механізму фолксономії, працювати з яким може довільний користувач, у той час як створювати метадані Семантичного Вебу можуть лише професіонали.
Прості успішні рішення Вебу 2.0 і величезна аудиторія активних користувачів відповідних ресурсів витісняють Семантичний Веб на задній план, проте привабливою видається перспектива хоча б часткового об’єднання цих концепцій, наприклад для надання механізму фолксономії додаткового семантичного навантаження.
Висновок.
Сьогодні у Вебі відбувається ряд якісних змін, які стосуються розробки, підтримки, використання Веб-ресурсів, обміну інформацією між ними тощо. Ці зміни репрезентовані двома визначальними концепціями розвитку Вебу: Веб 2.0 (яка стала мейнстрімовою) та Семантичний Веб (реалізована в меншій мірі). У статті запропоновано комплексний аналіз концепції Вебу 2.0 та порівняння її з Семантичним Вебом з точки зору перспективності подальшого розвитку.
Увага! Перед Вами скорочена версія статті. Повна версія статті подана до друку.
Recent comments
13 years 4 weeks ago
13 years 6 weeks ago
13 years 40 weeks ago
13 years 47 weeks ago
14 years 32 weeks ago
15 years 4 weeks ago
15 years 10 weeks ago
15 years 15 weeks ago
15 years 17 weeks ago
15 years 32 weeks ago