Інформаційно –пошукові системи (ІПС) — це різновид автоматизованих інформаційних
систем, в яких завершальна обробка даних не передбачається. Ці системи
призначені для пошуку текстів (документів, їх частин, фактографічних записів) в
сховищах (базах даних) за формальними характеристиками. Тому в роботі ІПС можна
виділити два основних етапи: перший — збір і зберігання інформації, другий —
пошук і видача інформації користувачам.
В
економіці ІПС можуть використовуватися для зберігання і пошуку нормативних, планових,
бухгалтерських та інших документів, даних для наукових досліджень.
ІПС
відрізняються одна від одної за багатьма ознаками, але при вирішенні задач
збору, зберігання і видачі інформації мають такі спільні процедури:
-
аналіз документів і їх добір;
-
створення пошукового образу документів (ПОД);
-
запис документів і їх пошукових образів на прийняті носії;
-
зберігання документів і ПОД;
-
аналіз запитів;
-
видача документів користувачам.
ІПС
можна класифікувати за такими ознаками:
-
родом виконуваних операцій;
-
режимом пошуку;
-
типом інформаційно-пошукової мови (ІПМ);
-
типом критерію відповідності;
-
ступенем автоматизації.
За
першою ознакою ІПС діляться на документальні,
фактографічні, логічні і комплексні.
Документальні ІПС на інформаційні запити
видають адреси зберігання пошукових образів, оригінали чи копії документів з
необхідною інформацією.
Фактографічні ІПС у відповідь на введені в них
інформаційні запити безпосередньо видають відповідні фактичні дані (структурний
склад, формули, характеристики матеріалів і тому подібне).
Логічні ІПС видають на запит не лише введену
раніше інформацію, але, якщо необхідно, виконують логічну переробку цієї
інформації для одержання нової, що явно в систему не вводилась.
Комплексні ІПС містять сукупність елементів
документальних, фактографічних і логічних ІПС.
За
режимом пошуку ІПС діляться на системи, що працюють в режимі вибіркового
розподілу інформації, тобто за постійними інформаційними запитами в масивах
постійно поповнюваних документів, і системи ретроспективного пошуку за разовими
змінними запитами абонентів з пошуком документів з даної тематики в масивах.
За
типом інформаційно-пошукової мови
ІПС класифікуються на системи з
природними (людськими) і інформаційними мовами. Інформаційно-пошукові мови — це
синтетично створені мови для ідентифікації і пошуку документів за запитом
(наприклад, дескрипторна мова).
За
критерієм відповідності, тобто сукупністю правил визначення ступеня формальної
відповідності між ПОД (ПОД — виражений у термінах мови ІПС основний зміст
документа, що займає значно менше машинної пам’яті від повного змісту
документа) і пошуковим розпорядженням ПР (ПР — виражений у термінах ІПС
пошуковий запит), ІПС поділяються на системи з використанням логічних схем (І,
ЧИ, НЕ); з використанням аналітичних функцій (статистичні і векторні критерії);
з використанням «вагових» функцій чи коефіцієнтів; з аналізом критерію
відповідності на збіг чи часткове входження (пошукового розпорядження в ПОД).
За
ступенем автоматизації ІПС класифікуються на системи з автоматичною
класифікацією масивів (формування в ПОД породження класів за мітками, на основі
асоціативних зв’язків між термінами в ПОД), системи з автоматичним пошуком для
сортування і порівняння ПОД з пошуковим розпорядженням, системи з автоматичним
індексуванням для автоматизації процесів згортання при реферуванні, анотуванні,
виборі ключових слів і т. ін., системи з автоматичною видачею різновидів
інформації (бібліографічних описів, ПОД, копій документів), системи з
автоматичним управлінням (при наявності зворотного зв’язку і зміни режимів
пошуку в ІПС).
Як
уже зазначалося, на основі ІПМ використовують два основних режими чи методи
організації пошуку: з вибірковим
розподілом інформації і з ретроспективним пошуком.
При
цьому застосовують різні мовні засоби, залежно від категорії користувачів і
можливостей мов. Використовують мови, що забезпечують тільки можливості
запитів, тобто виведення даних на екран чи друк в необхідному форматі;
комплексні мови запитів-обновлень, що як більш розвинені мови дозволяють
формулювати запити, які стосуються декількох взаємозв’язаних записів і
дозволяють поновляти дані так же легко, як і формулювати запити; генератори
звітів, що дозволяють вибирати необхідні дані і форматувати їх у вигляді
потрібних форм документів; графічні мови, що дозволяють виводити інформацію у
вигляді різних графіків і діаграм та інших зображувальних засобів.
При
створенні ІПС неминуче виникає потреба у створенні тезаурусу системи, тобто
набору спеціальних термінів для кодування понять та зв’язків між ними. Тезаурус
дозволяє виражати зміст документів та запитів формалізованою інформаційною
мовою.
Найбільш поширеними в сучасних автоматизованих ІПС є тезауруси з використанням мов
дескрипторного типу, на відміну від тезаурусів з мовами класифікаційного типу,
що використовуються, наприклад, в бібліотечно-бібліографічній класифікації з
фіксованим обмеженим списком слів і словосполучень. Дескрипторами можуть бути
окремі слова або словосполучення із групи синонімічних чи близьких за значенням
слів, що використовуються в системі для контрольованого індексування
(кодування) змісту документів і запитів встановленням відповідності між текстом
документа і набором ключових дескрипторів.
Джерело: http://library.if.ua/book/100/6867.html |