Аналітичні матеріали та блог про сучасні інформаційні технології. Основні теми: Інтернет та WWW, комплексна автоматизація підприємств та установ, інформаційна безпека, системи аналітичної обробки інформації.

Енциклопедія від Google

Google вирішив створити свою енциклопедію, яка має стати аналогом та конкурентом Wikipedia.
Цікавим мені видався факт, що автори статей зможуть заробляти на контекстній рекламі, яка буде розміщена на сторінках з їхніми статтями. Цікаві статті матимуть хорошу відвідуваність. А це значить, що автори цікавих статей, зароблятимуть гроші.
Думаю, така ідея має гарні перспективи, бо гроші, хоч і невеликі більше стимулюватимуть до написання якісних статей. Крім того між авторами виникне конкуренція, щоб саме їхня стаття була розміщена в енциклопедії.
З іншого боку, зрозуміло, що автори будуть "битися" лише за "топові" теми, в той час як непопулярні теми можуть залишатися невисвітленими взагалі.

Інтеґрація даних у сховищах даних

Необхідність інтеграції даних виникає через неоднорідність програмного середовища, розподілений характер організації, підвищені вимоги до безпеки даних, необхідність наявності багаторівневих довідників метаданих, потребу в ефективному зберіганні й опрацюванні дуже великих обсягів інформації.

Інтеґрація даних – це об'єднання даних, які спочатку вводяться в різні системи. Самі ці системи можуть розташовуватися в одній локальній мережі, але мати різні платформи і внутрішню архітектуру. Метою інтеґрації даних є отримання єдиної і цілісної картини корпоративних даних предметної області. Інтеґрація даних може бути описана за допомогою моделі, яка включає застосування, продукти, технології та методи.

Існує три основні методи інтеґрації даних: консолідація, федералізація і розповсюдження.

Консолідація даних – це збирання даних з територіально віддалених або різноплатформенних джерел даних в єдине сховище даних з метою їх подальшого опрацювання та аналізу.

У середовищі сховищ даних однією з найпоширеніших технологій підтримки консолідації є технологія ETL (витягання, перетворення і завантаження – extract, transform, and load). Ще одна поширена технологія консолідації даних ECM - керування змістом корпорації (enterprise content management). Більшість рішень ECM напрямлені на консолідацію і керування неструктурованими даними, такими як документи, звіти і web-сторінки.

Федералізація даних забезпечує єдину віртуальну картину одного або декількох первинних файлів даних. Процес федералізації даних завжди полягає у витяганні даних з первинних систем на підставі зовнішніх вимог. Всі необхідні перетворення даних здійснюються при їх витяганні з первинних файлів. Прикладом федералізації є інтеґрація корпоративної інформації (EII).

Багатовимірна модель даних

Багатовимірна база даних – база даних, що підтримує багатовимірну модель даних на концептуальному рівні та призначена для інтерактивного аналітичного опрацювання аґреґованих історичних і проґнозованих даних.

Основними поняттями багатовимірної моделі даних є:

  • гіперкуб даних rel,
  • вимір V,
  • атрибут A,
  • комірка X,
  • значення rel(V,A).
  • Гіперкуб даних містить один або більше вимірів і є впорядкованим набором комірок. Кожна комірка визначається одним і лише одним набором значень вимірів – атрибутів. Комірка може містити дані – значення або бути порожньою.

    Під виміром розумітимемо множину атрибутів, що створюють одну з граней гіперкуба. Прикладом часового виміру є список днів, місяців, кварталів. Прикладом географічного виміру може бути перелік територіальних об'єктів: населених пунктів, районів, реґіонів, країн та ін.

    Для отримання доступу до даних користувачу необхідно вказати одну або декілька комірок шляхом вибору значень вимірів, яким відповідають необхідні комірки. Процес вибору значень вимірів називатимемо фіксацією атрибутів, а множину вибраних значень вимірів – множиною фіксованих атрибутів.

    Гіперкуб даних можна розглядати як множину відношень реляційної бази даних за значеннями кожного з вимірів. Отже, носієм багатовимірної моделі даних є відношення реляційної бази даних, зображені як зафіксовані виміри. Гіперкуб утворює багатовимірний простір даних, що складається з фіксованої кількості вимірів.

    Операція зрізу здійснюється з метою отримання необхідної підмножини комірок і відсікання «непотрібних» значень шляхом послідовної фіксації атрибутів. Зріз, як правило, є двовимірним масивом (таблицею).

    Зміна порядку подання (візуалізація) вимірів називається обертанням. Обертання забезпечує можливість візуалізації даних у формі, найбільш комфортній для їх сприйняття.

    Атаки на відмову: причини виникнення, огляд, класифікація.

    Мережу Інтернет (спочатку відому під назвою ARPANET) було створено в 1969 році як дослідницьку мережу на замовлення Міністерства Оборони Сполучених Штатів Америки. Початкова мета розробки полягала в створенні відкритої мережі для обміну науковими ресурсами між ученими. Виходячи з цієї концепції проектувалася і схема його функціонування. В результаті було розроблено мережу на основі комутації пакетів (packet switching), яка принципово відрізнялась від відомих тоді систем комутації ліній (circuit switching), таких як телефонна мережа. Це дозволило значно підвищити гнучкість та живучість системи. Однак успіх був досягнуто ціною ослаблення безпеки. В мережі Інтернет будь-хто може надіслати будь-який пакет будь-кому і при цьому одержувач повинен обробити пакет, який прийшов належним чином. Ослаблення безпеки полягає в тому, що зловмисник може сформувати фальшиву ідентичність та безкарно надсилати шкідливий трафік, тому всі системи, що з’єднані з мережею Інтернет перебувають в потенційній небезпеці, оскільки відкритість робить їх доступними для атакуючого.

    Подарунок для Цьоці Асі. ICQ та інтелектуальна власність.

    Найпопулярнішим сервісом миттєвих повідомлень на просторах СНД була і є така собі ICQ. Якось так історично склалося, що не мати і не користати ICQ є практично моветоном для активного користувача Інтернету в наших краях. Навіть мене, що я дуже не люблю цей сервіс, життя таки заставляє інколи ним користати.
    Проте є речі, які виділяють “Асю” з числа подібних сервісів. Притому не в кращу сторону (хоча інші сервіси миттєвих повідомлень також дуже далекі не те, що від ідеалу, а просто від нормальної телекомунікаційної служби).
    Зупинюся на одній особливосі ICQ. Дуже суттєвій. Чи пробував хтось читати угоду користувача, коли підписував її при активації сервісу? Там є справжній шедевр. А всласне ось тут http://www.icq.com/legal/policy.html

    Структурне подання часу

    Дослідники часу розрізняють два способи його подання: порядковий та структурний. Порядковий спосіб передбачає подання часу за допомогою натуральних чисел. Структурний спосіб ґрунтується на понятті структурування.
    Розглянемо скінченну множину , на якій задане відношення порядку. Тобто .
    Структуруванням множини називається пара , де , і – бієктивне відображення, яке кожному елементу множини ставить у відповідність скінченний закритий інтервал множини , причому:
    1. .
    2. .
    Часовим універсумом називається скінченна множина , де – часові домени, – відображення, яке ділить (структурує) множину на блоки (інтервали) елементів, що відповідають елементам множини .
    Відображення часового універсуму фактично задають календарну систему часу. Кожна предметна область визначає часовий універсум.

    Математичне визначення часу

    Час – це безмежна щільна множина елементів, на якій визначено відношення порядку. Ця множина є ізоморфною до множини дійсних чисел, тобто часова вісь подається як вісь дійсних чисел. Таке визначення належним чином відображає усі аспекти часу як одного з елементів дійсності.
    В області баз даних часову вісь визначають як зліченну дискретну множину, на якій задано відношення порядку (“менше рівне”). Елементи цієї множини називаються часовими моментами.

    Рис. 1. Часова вісь.
    На рис. 1 зображено часову вісь з дискретними моментами часу. Причому:


    Дискретна часова вісь ізоморфна до множини натуральних чисел.

    http://pzhe.net/ua/tdb/time_mathdef

    Поверхневий аналіз реалізації Dos атаки

    Щось цим пасмурним вечором згадалася мені весна, коли сніг розстанув, на дворі вже проблискувало тепле сонечко, в Естонії проводили акцію перезахоронення радянських вояків і у зв’язку з протестом невідомих ( ну, це офіційно невідомих) була здійснена потужна DoS-атака на найпотужніший банк країни SEB Eesti Uhispank та газету Eesti Paevaleht.
    DoS- атака ( атака на відмову в обслуговуванні) це скерування великої кількості запитів на веб-сервер. Зазвичай така атака проводиться роботами-ботами і призводить до зупинки роботи сервера. Середня вартість такої атаки на українському ринку складає 60-80 дольців.
    Зазвичай DoS атака зупиняється блокуванням ІР-адреси атакуючої машини, проте зазвичай доводиться відключати цілі фрагменти мережі, жертвуючи потенційною аудиторією, що може відвідати сайти. Такі атаки проводяться бот-мережами, вважається, що зараз у бот-мережі задіяно біля 150 млн. комп’ютерів.

    Правильний підхід до розробки сайту – запорука успіху

    Останнім часом мережа Internet стала для багатьох засобом заробітку грошей, який має значні переваги в порівнянні з традиційними сферами бізнесу. Відносно легкий спосіб розпочати власну справу часто вводить в оману, через яку початківці погано представляють собі, як ці можливості правильно використовувати.

    Одним із найбільш популярних аспектів мережі Internet і в той же час найдешевшим є розробка Web-сайтів.

    В цій статті ми спробуємо розібратись, що потрібно врахувати, щоб розробити успішний сайт. Також Ви дізнаєтесь: чому для того, щоб створити хороший ресурс, недостатньо знань декількох графічних редакторів, основ програмування чи розкрутки Web-сайтів та, сподіватимемося, зрозумієте наскільки складно стати в даній області спеціалістом пристойного рівня.

    Підготовчий етап створення сайту

    Які сайти варто робити?

    Спочатку спробуємо розібратись, які сайти слід створювати.

    Тенденції в українському сегменті Internet свідчать, що цікавими для відвідувачів є вузькопрофільні, спеціалізовані ресурси. Як і в будь-якому іншому бізнесі тут важливо передбачити, що потребуватимуть Internet-користувачі в майбутньому.

    Проте, в будь-якому випадку корпоративний сайт слід робити обов’язково! Навіть у випадку мінімальної віддачі.

    Створювати загально популярні сайти (ресурси, які охоплюють багато сфер людської діяльності), а тим більше отримувати помітну грошову віддачу, дуже важко. Не забувайте також, що на стороні Ваших конкурентів – досвід і авторитет. Ситуація загострюється ще й тим, що в Уарнеті зі зростанням користувачів мережі з’явилися великі гроші (по-українських мірках).

    Простори даних - нова абстракція керування даними

    І бази даних, і сховища даних дозволяють опрацьовувати деталізовані та інтегровані дані, що побудовані на основі наперед допустимих моделей даних. У випадку роботи у всесвітній мережі з величезною кількістю ресурсів (прикладами таких задач є туристичний бізнес – збирання інформацію про місця відпочинку, її інтеграція та зберігання у внутрішніх базах даних, геоінформаційні системи – на сьогодні ще не розроблено єдних стандартів подання такої інформації, а її збір також проходить із джерел з наперед невідомими моделями даних) неможливо визначити, які саме моделі даних використовуватимуться. Тому виключно за допомогою баз даних та сховищ даних не можна організувати ефективної взаємодії між усіма об'єктами у цих предметних областях. Розробники часто зустрічаються з набором слабо зв'язаних джерел даних і тому повинні кожного разу вирішувати низькорівневі завдання управління даними. У число цих завдань входять забезпечення можливостей пошуку і запиту даних; дотримання правил, обмежень цілісності, угод про іменування і т.д.; відстежування походження даних; забезпечення доступності, відновлення і контролю доступу; керований розвиток даних і метаданих.

    Традиційні СКБД представляють тільки одну точку (хоч і дуже важливу) в просторі рішень управління даними. Важливою точкою є "системи інтеграції даних. Насправді, системи інтеграції даних і обміну даними традиційно призначаються для підтримки багатьох інших служб в системах просторів даних. Особливість полягає у тому, що в системах інтеграції даних потрібна семантична інтеграція до того, як можуть бути забезпечені які-небудь інші послуги. Тому, хоч і відсутня єдина схема, якій відповідають всі дані, система повинна знати точні взаємозв'язки між елементами, що використовуються в кожній схемі. В результаті для створення системи інтеграції даних потрібна значна попередня робота.

    Бази даних та сховища даних: спільні та відмінні риси

    Як відомо, для зберігання та опрацювання даних використовують різні засоби: бази даних, сховища даних, оперативні сховища даних. Дамо визначення цих понять та здійснимо їх характеристику.

    Наведемо декілька найбільш поширених визначень бази даних (БД).

    База даних – сукупність екземплярів різних типів записів і відношень між записами та елементами.

    Базу даних можна визначити як сукупність взаємозв'язаних даних (прості чи складені типи), що зберігаються разом на одному носії та описують якусь предметну область за наявності такої мінімальної надмірності, яка допускає їх використання оптимальним чином для одного або декількох застосувань. Розрізняють ієрархічні, мережеві, реляційні, часові (темпоральні), постреляційні (об’єктно-орієнтовані, з гніздуванням), розподілені та багатовимірні бази даних.

    Використання бази даних припускає роботу з нею декількох прикладних програм (застосувань), що вирішують завдання різних користувачів.

    Сховище даних – це аґреґований інформаційний ресурс, що містить консолідовану інформацію з усієї проблемної області та використовується для підтримки прийняття рішень.

    Ідея, час якої настав -2

    Реформуванню та зміні підлягають не тільки системи глобального пошуку, а й системи локального пошуку, інакше кажучи системи пошуку інформації у корпоративних системах. Системи такого типу дозволяють знайти фактично довільну інформацію – починаючи із текстових документів і закінчуючи вмістом кешу браузера, але, нагадую, в межах корпоративної системи. Основними постачальниками таких продуктів є Google, Yandex та ін. Пригадується, як кілька років тому на ринку тільки з’явився Google Desktop. Майже кілька днів по тому його встигли оголосити потенційно небезпечною програмою, через те що він проводив індексацію всіх поштових повідомлень, і цим самим можна було обійти пароль до поштової скриньки. Потім у системі Google Mini була віднайдена вразливість, в результаті якої можна було виконати сценарій чи html-код. Єдине що радує в роботі такого монстра, як Google це оперативна робота. Вразливості у програмних продуктах і так доволі рідко знаходять, так ще й реакція на них є блискавичною. Після виходу у світ Google Desktop 2 знову посипались обвинувачення на адресу цього продукту, який надавав доступ до закритої інформації. Але потім виявилось що це даремно, оскільки вразливість була у Internet Explorer. Підсумовуючи ці випадки, важливо замітити, що найбільша загроза яка виникає при використанні пошуковців такого типу – це втрата конфеденційної інформації. Але чи є тут вина таких пошуковців. Частково так, через помилки допущені при написанні таких програм. Проте основна вина все ж лежить на керівниках, відповідальних за безпеку інформаційної системи. Якщо є відсутньою система фільтрації документів, що відправляється у зовнішній світ, якщо немає контролю підключення до USB портів, якщо до конфеденційної інфрмації має доступ будь-яка особа то це вина аж ніяк не пошуковця.

    Сайт про електронні книги

    Рекомендуємо вашій увазі новий щойно започаткований сайт, присвячений тематиці спеціалізованих пристроїв для читання електронних книг - Електронні книги та читалки

    Ідея, час якої настав

    У продовж останніх років одною з найважливіших задач сайтобудування є задача популяризації сайту.
    Існують різні підходи до вирішення даної задачі. Проте, для більшості з них характерним є боротьба за покращання позиції сайту в пошукових системах. Дана задача вимагає досить компексного аналізу сайту на всіх етапах розв'язання. Причому аналізу достатньо специфічного – аналізу не стільки “внутрішнього”, коли аналізується вміст, структура чи журнали сайту, а “зовнішнього”, коли аналізується ставлення WWW до сайту.

    Інформація для науковців

    До 15 жовтня проводиться набір статтей у вісник "Комп"ютерні системи та мережі" Національного університету "Львівська політехніка" Інституту комп"ютерних технологій автоматики та метрології кафедри "Електронні обчилювальні машини". Вісник має статус ВАК, а тому і статті слід оформляти згідно вимог. З питань оформлення та прийому статті звертатись на поштову скриньку andrie83@gmail.com до Андрухіва Андрія( додаткова контактна інформація за адресою http://it.ridne.net/user/123)

    Інформаційне суспільство по-українськи

    Десь весною цього року (ще до парламентської кризи) ВРУ прийняла, а Президент підписав закон "Про Основні засади розвитку інформаційного суспільства в Україні на 2007-2015 роки".

    Закон сам по собі чарівний. Прочитав. Одна суцільна декларація. При тому безсистемна. Єдині цифри, що є в законі - це роки :). Іншої конкретики також катма.

    Ну Бог з ним.
    Прикололо інше.
    Натрапив на сторінку http://www.stc.gov.ua/uk/publish/article/56836 , де мають бути "план заходів з виконання завдань, передбачених Законом України "Про Основні засади розвитку інформаційного суспільства в Україні на 2007-2015 роки"" - а це вже цікавіше і ближче до життя.

    Але на жаль, після клацу на лінк " „Про затвердження плану заходів з виконання завдань, передбачених Законом України "Про Основні засади розвитку інформаційного суспільства в Україні на 2007-2015 роки”" де власне, напевне і є напевно перелік заходів включно фінансуванням, виконавцями і термінами потрапляю на сторінку з печальним текстом
    "Цього документу немає в базі даних "

    Отака вона, реальність інформаційного суспільства в Україні. :(

    Як зробити сайт легким у користуванні та зручним для відвідувачів

    В цій статті ми розглянемо загальні принципи проектування зручного Web-сайту. Тобто, спробуємо розібратись, як організувати Web-сторінку так, щоб вона була максимально зручною для відвідувача.


    1. Як правильно організувати загальний шаблон сторінки

    Перш ніж приступити до роботи потрібно обрати один із способів верстки (гумовий дизайн, дизайн з фіксованою шириною). Розглянемо трохи детальніше ці дві можливості.

    Google Bombing. 3 роки за образу Президента Польщі

    3 роки ув'язнення загрожує поляку, який використав технологію розкрутки сайту за допомогою зовнішніх посилань з метою образи Президента Польщі. Він успішно досягнув того, що за одним лайливим польським словом офіційний сайт Президента Польщі кілька місяців займав перше місце на Гуглі.
    Такий вид "оптимізації" не є чимось новим, і має навіть власний термін - Google Bombing. І ніби (за деякою інформацією з тематичних форумів) Google якось пробує від нього захиститися, але видно, поки що не дуже успішно. Новим тут є притягнення чоловіка до кримінальної відповідальності за такі дії. Звичайно, така справа нова для правосуддя, тому не виключено, що жорсткої кари не буде, проте сам факт такого "бомбування" встановлено достеменно.
    Детальніше про справу можна почитати тут http://wiadomosci.gazeta.pl/Wiadomosci/1,80269,4477719.html

    Використання методу TRACE для здійснення XSS/SCC атаки

    Зараз існує ціла серія програмних сканерів безпеки які цілком якісно можуть провести діагностику захисту сервера. В більшості серверів сканер видає повідомлення про наявність(функціонування) методу trace. Чомусь прийнято вважати, що це діра в захисті і її можна використати для взламування. Це правда, але часково. Метод TRACE призначений для діагностики мережі. Принцип роботи приблизно наступний – клієнт відсилає серверу певну інформацію, а сервер у свою чергу відпраляє отриману інформацію назад. Якщо в результаті була отримана видозмінена інформація – що десь не спрацювало. Проте цей метод був використаний для здійснення XSS атак: в TRACE запиті на сервер передаються кукіси, якщо вони є. Тому можна запит перехватити і витягнути звідти все що потрібно.

    І знову новий сервіс від Google

    Цього разу як доповнення до Google Earth компанія випустила Google Sky. Користувачі сервісу мають тепер змогу побачити супутникові знимки Землі із пристойним розширенням. Крім цього, як стверджує Reuters можна побачити біля 100 млн зірок і 200 млн галактик. Всі знимки для Google Sky надала Digital Sky Survey, каліфорнійська обсерваторія Паломар та центр астрономії Об’єднаного Королівства.
    Нагадаю, що створити такий сервіс Google хотіла вже давно. Першими спробами були карти Місяця та Марса.

    Syndicate content

    © Інформаційні технології. Аналітика , Рідна Мережа