referat-ok.com.ua

Для тих хто прагне знань!

Застосування аналітико — синтетичної переробки інформації у вікі-системах

ПЕРЕЛІК УМОВНИХ СКОРОЧЕНЬ

АСПДІ аналітико синтетична переробка документної інформації
АСПІ аналітико синтетична переробка інформації
ІПМ інформаційно-пошукова мова
ПОД пошуковий образ документа
ПОЗ пошуковий образ запиту
ПП пошуковий припис
БО бібліографічний опис
БЗ бібліографічний запис
ІПТ інформаційно-пошуковий тезаурус

ВСТУП

Актуальність. З кожним роком зростає обсяг і потужність інформаційного потоку. Упорядкувати цей потік і тримати його в контрольованому руслі можна тільки за допомогою автоматизованих систем обробки та переробки інформації. В основі цих систем (методів) лежать процеси аналізу первинних документів (індексація і предметизація) і синтезу (генерація вторинних документів, складання каталогів).

Поняття “аналітико-синтетична обробка документів” має різне тлумачення і різне наповнення, що відображається на змісті учбової дисципліни. Спираючись на сучасні термінологічні словники, стандарти, посібники, можна встановити, що в інформатиці під аналітико-синтетичною обробкою інформації розуміють переробку інформації, що міститься в документах з метою вилучення необхідних відомостей, їх оцінки, порівняння і узагальнення. В бібліографії аналітико-синтетичну обробку документів розуміють як процес бібліографування, а саме процеси, що забезпечують ідентифікацію документів, інформацію про них. В каталогізації метою аналітико-синтетичної обробки є розкриття складу і змісту документального фонду, що дає можливість ідентифікувати документи і здійснювати бібліографічний пошук. Кожна галузь визначає певні види або процеси аналітико-синтетичної обробки. В інформатиці це, як правило, анотування, реферування, вилучення фактів і підготовка оглядів; в бібліографії – складання бібліографічних описів (БО), анотування, індексування, складання бібліографічних оглядів та покажчиків; в каталогізації – складання БО, індексування, анотування.

Основою АСПДІ є згортання інформації – зменшення фізичного обсягу інформаційного повідомлення, що поширене в багатьох галузях знання.

Для задовольняння потреб споживачів застосовуються різні способи згортання інформації: семантичне й лексичне, макро- й мікроаналітичне.

При макроаналітичному згортанні наводять формальні відомості про документ і найзагальніші – про його зміст, при мікроаналітичному детально розкривають зміст документа (основні й побічні теми, аспекти їх розгляду).

Мета курсової роботи в теоретичному обґрунтуванні застосування аналітико-синтетичної переробки інформації у вікі-системах.

Поставлена мета визначає головні завдання, що підлягають вирішенню в даній роботі:

  • розглянути сутність, призначення та види аналітико-синтетичної переробки інформації;
  • визначити макроаналітичне згортання інформації у вікі- системах;
  • проаналізувати мікроаналітичну переробку інформації у вікі-системах.

Об’єктом курсової роботи є процес дослідження застосування аналітико-синтетичної переробки інформації у вікі-системах.

Предметом курсової роботи є теоретичні аспекти з вивчення застосування аналітико-синтетичної переробки інформації у вікі-системах.

Методами курсової роботи є метод ситуаційного аналізу, методи порівняльного та системного аналізу.

Основними теоретичними і методологічними джерелами при написанні даної роботи були літературні джерела, наукові статті, журнали.

1. Аналітико-синтетична переробка інформації: сутність, призначення, види

В епоху інформатизації суспільства інформаційні потоки перевищують можливості людства щодо їхнього ефективного використання.

Впровадження інформаційних систем, ефективних засобів і методів переробки та пошуку інформації дають можливість користувачам з інформаційного масиву вибрати необхідну ревалентну інформацію.

Слід зазначити, що в інформаційних масивах інформаційно-пошукової системи представлені не самі документи, а їх пошуковий образ документів, бібліографічні описи, анотації, реферати, тобто вторинна інформація, тому основним призначенням аналітико-синтетичної переробки інформації є створення вторинної інформації. Аналітико-синтетична переробка інформації будується на використанні методів інформаційного аналізу й синтезу, має назву аналітико-синтетична переробка [6; с.147].

Інформаційний аналіз – це початковий етап перетворення документної інформації, який включає вивчення документів і виявлення із них найбільш суттєвих відомостей. Так, наприклад, при складанні бібліографічного опису на документи, з’ясовують відомості про авторів, назви документа, вихідні дані і т.п.

Інформаційний аналіз пов’язаний із синтезом, тобто, узагальненням інформації, отриманої в результаті інформаційного аналізу документів, і підготовки (представлення) результатів узагальнення в тій чи іншій формі. Так, наприклад, одержані в результаті інформаційного аналізу відомості про авторів, назва документа, вихідні дані тощо об’єднуються (синтезуються) у формі бібліографічного опису, тобто створюється вторинний документ.

Таким чином, аналітико-синтетична переробка інформації – це процеси перетворення змісту документів з метою їх аналізу, виявлення необхідних відомостей, а також оцінки, співставлення та узагальнення, тобто створення вторинної інформації.

Але слід зазначити, що аналітико-синтетична переробка інформації не обмежується тільки здійсненням аналізу та синтезу. Їй притаманне також використання методу абстрагування, який допомагає виділити з усіх ознак документної інформації саме ті, що найбільш цікаві користувачам, і відкинути другорядні.

Метод узагальнення забезпечує згортання інформації, яку містить первинний документ, передбачає застосування способів перетворення великих обсягів інформації у більш компактну, але досить містку форму.

У процесі аналітико-синтетичної переробки інформації відбувається згортання інформації, завдання якого полягає у змістовній оцінці значимості документа та зменшення фізичного обсягу або змін знакової форми документа за умовами мінімальної втрати інформативності.

У залежності від глибини аналізу, розрізняють макроаналітичне та мікроаналітичне згортання інформації [25; c.78-79].

Макроаналітичне згортання полягає у відображенні у вторинному документі формальних ознак первинного та загальних відомостей про його зміст.

До макроаналітичного згортання відносяться такі види (процеси), як складання бібліографічного опису, анотування, результатом яких є створення бібліографічних описів і анотацій. Складання бібліографічного опису – це процес стандартизованого представлення основних даних про документ.

Анотування – це процес складання коротких відомостей, що характеризують документ з точки зору його змісту, форми, цінності, читацького призначення, оформлення тощо.

У процесі переробки первинної інформації згортанню може підлягати будь-яка кількість джерел інформації. Результатом такого згортання є огляди. Але слід зазначити, що тут також можлива різна глибина інформаційного аналізу. Так, наприклад, результатом макрозгортання кількості документів є бібліографічний огляд – зведена узагальнена характеристика декількох документів. У бібліографічному огляді наводиться узагальнений опис змісту елементів і формальних ознак, які характеризують оглядові джерела інформації, які подаються в співставленні один з одним. Призначення таких оглядів – орієнтація користувачів у документальних потоках.

До мікроаналітичного згортання інформації відносяться: реферування; реферативні та аналітичні огляди; індексування.

Реферативний огляд є результатом аналізу документальних джерел з метою відбору фактів, які глибоко розкривають тему огляду.

Аналітичний огляд – результат аналізу документальних джерел і оцінки, визначеної інтерпретації виявлених із них фактів.

Індексування – це процес опису змісту та форми документа засобами штучної інформаційно-пошукової мови (ІПМ). Результатом індексування документа є його пошуковий образ (ПОД), який представляє собою набір лексичних одиниць (індексів) інформаційно-пошукової мови, прийнятої в інформаційно-пошукової системі, що відповідають основним предметам і аспектам змісту документа. Індексуванню підлягають і інформаційні запити користувачів [6; c.123].

Результатом індексування запиту є його пошуковий образ (ПОЗ) – сукупність понять про головні теми, аспекти запиту, які виражені інформаційно-пошуковою мовою.

Пошуковий припис (ПП), окрім індексів запиту містить вказівки, що необхідні для проведення інформаційного пошуку.

Таким чином, в результаті аналітико-синтетичної переробки первинних документів отримують вторинні документи, які в свою чергу можуть бути синтезовані в різноманітні джерела вторинної інформації: інформаційні видання, каталоги, картотеки, огляди, банки даних тощо.

Аналітико-синтетичну переробку інформації здійснюють всі інформаційні заклади [10; c.308].

2. Макроаналітичне згортання інформації у вікі-системах

До макроаналітичного згортання інформації відносяться складання бібліографічного опису та анотування.

Бібліографічний опис (БО) – це записана за певними правилами множина бібліографічних даних, що ідентифікують документ. Друга задача – створення образу (в т.ч. пошукового) документа. Бібліографічні дані є конкретними відомостями про назву, автора твору, місце, рік видання тощо. БО дає уявлення про зміст, вид, призначення, актуальність документа, а також дає змогу його ідентифікувати.

Бібліографічний опис є складовою бібліографічного запису (БЗ), який може подавати, окрім БО – заголовок, класифікаційні індекси, предметні рубрики.

Анотація БО складається з бібліографічних документів, які містять відомості про певні ознаки документів.

Становлення системи електронних інформаційних ресурсів в Україні зумовлено стрімким розвитком інформаційних технологій і їх широким впровадженням у різні сфери життя.

На розвиток системи електронних інформаційних ресурсів впливає також прогрес суспільства та його перехід до якісно нового стану – інформаційного.

Наш час характеризується появою великої кількості правил складання бібліографічних описів різних видів документів. В Україні нормативно-методична база опису електронних ресурсів знаходиться в стадії розробки, тому більшість органів інформації і бібліотек користуються методичними матеріалами, підготовленими на базі даного стандарту [16; c.147-148].

Вікі-системи представляють собою електронні дані (інформацію у вигляді чисел, літер, символів або їх комбінацію), електронні програми (набори операторів або підпрограм, що забезпечують виконання визначених задач, включаючи обробку даних) або сполучення цих видів в одному ресурсі.

Методика складання БО вікі-систем – це сукупність прийомів і правил, які використовуються в процесі БО.

Специфіка складання БО вікі-систем проявляється в наповненні, формі та способі представлення елементів, від яких залежить їх ідентифікація. Перш за все, це загальне та специфічне позначення матеріалу; основні характеристики в зоні виду та обсягу ресурсу; дані про фізичні носії електронного ресурсу, системні вимоги та інші специфічні характеристики.

Бібліографічний опис (БО) вікі-систем є основною частиною бібліографічного запису (БЗ) і містить бібліографічні відомості за встановленими правилами, що дозволяють ідентифікувати вікі-системи, а також ознайомитися з його змістом, призначенням, фізичними характеристиками, системними вимогами, режимами доступу, способами розповсюдження і т.п.

БО вікі-систем складається з елементів, що об’єднані в зони і розташовані у встановленій послідовності.

Елементи БО підрозділяються на обов’язкові та факультативні.

Крім того, БО може бути доповнений різними елементами БЗ: заголовком, предметними рубриками і т.п., котрі є об’єктами інших стандартів СИБИД.

Позначення вікі-систем, як широкого класу документів, відображено в зоні назви та відомостей про відповідальність, як загальне позначення матеріалу.

Інформація для складання БО вікі-систем береться із визначених елементів вихідних відомостей ресурсу та інших джерел у відповідності до запропонованої черговості їх використання. Для кожної зони вікі-системи встановлені джерела інформації [3; c.28].

Таким чином, БО вікі-систем подає найважливіші відомості про ресурси, які дають змогу отримати уявлення про їх призначення, зміст тощо, відрізнити їх від інших видів документів і розшукати в інформаційно-пошукових масивах.

При наявності функціонування різних потоків інформації виникає об’єктивна необхідність її уніфікації (стандартизації).

Стандартизація – це встановлення в державному масштабі єдиних норм і вимог щодо матеріалів, процесів, приборів і т. п.

До об’єктів стандартизації відносяться: термінологія, види та комплектність документів, вимоги до створення окремих видів документів, оцінка якості та ін.

Анотування є поширеним технологічним процесом, який широко застосовується у всіх видах інформаційної діяльності і пов’язаний із значними інтелектуальними і часовими затратами. Цей процес передбачає скорочення фізичного обсягу первинного документа при збереженні його основного змісту. Метою анотування є одержання узагальненої характеристики документа, що висвітлює його логічну структуру та найбільш сутнісні сторони змісту. При цьому текст анотації не повинен доповнюватися новими відомостями, які безпосередньо не відносяться до змісту першоджерел. Він має показати місце первинного документа у системі знань, інтерпретує його у формі оціночних суджень і робить максимально доступним для читача.

Складання анотацій є чи не найбільш творчим і досить суб’єктивним процесом аналітико-синтетичного згортання семантичної інформації з першоджерела, він найменш формалізований і тому вимагає від анотатора високого рівня професіоналізму і вмілого застосування загальнонаукових і спеціальних методів. Серед загальнонаукових методів використовуються, перш за все, такі, як аналіз, синтез, абстрагування і узагальнення.

У процесі анотування проводиться загальний аналіз документа в цілому і поглиблений – його змісту. Останнє передбачає усвідомлення анотатором основних аспектів змісту; визначення, яка сааме інформація відноситься до кожного з виділених аспектів; прийняття рішення про інформативні частини тексту первинного документа, які доцільно включити в анотацію та про надлишкову інформацію, яка залишається поза увагою.

У процесі анотування синтез передбачає об’єднання в одне логічне ціле цінної інформації, виявленої в результаті аналізу змісту первинного документа. У процесі синтезу створюється новий документ, в якому забезпечено новий взаємозв’язок його змістовних частин.

Такий метод наукового пізнання як абстрагування в процесі анотування допомагає подумки виділити з усіх ознак, властивостей, якостей, зв’язків конкретного предмета основні, найбільш загальні зв’язки. Цей метод сприяє вирізненню окремих, цікавих для читача відомостей, і відволіканню від другорядного.

При анотуванні метод узагальнення допомагає дотримуватися послідовності і логічного комплексування окремих думок, взаємопов’язано і компактно викласти зміст першоджерела. Це пошук більш містких засобів і форм подання інформації, в результаті чого досягається її ущільнення, або згортання.

Документознавцю в процесі анотування надзвичайно важливо знати і вміло застосовувати інформаційний аналіз [22; c.31-32].

Анотація – це інформація про інформацію на рівні узагальнених понять, суджень та оцінок і відноситься до макроінформації про документ. Вона є не формальною, а змістовою моделлю документного джерела, відмінною ознакою якої виступає обов’язкова наявність бібліографічного опису першоджерела.

Анотація як результат аналітико-синтетичної переробки інформації усвідомлюється як вторинний документ, що вміщує коротку узагальнюючу характеристику первинного документа, його частини чи групи документів з погляду призначення, змісту та інших особливостей.

Як вторинний документ, анотація має такі властивості: подає семантичну інформацію з первинного документа у згорнутому, узагальненому вигляді; супроводжує бібліографічний опис першоджерела і є результатом переробки інформації з нього.

Відповідно до викладу інформації, в анотації вона може бути: документом-екстрактом (тобто, побудованим на реченнях, екстрагованих з тексту вихідного документа; такими, наприклад, бувають анотації, створені в електронній формі); перефразованим документом (тобто, в процесі ущільнення семантичної інформації з першоджерела анотатор передає його зміст своїми словами); інтерпретованим (синтезованим) документом (тобто, зміст першоджерела або його певної частини може подаватися анотатором з тлумаченнями, роз’ясненнями його змісту, а також з рекомендаціями щодо використання). Але при виборі певних методів викладу інформації в анотації має враховуватися її цільове і читацьке призначення та мета анотування.

Важливо пам’ятати, що в анотації не слід наводити відомості, які представлені у бібліографічному описі, вона має доповнити заголовок документа характеристикою його змісту.

Основні функції анотації як вторинного документа: сигнальна, пошукова і оціночна.

Сигнальна функція (комунікативна) представляє інформацію про документ і надає можливість встановити основний його зміст, визначити ревалентність і прийняти рішення про доцільність звернення до нього.

Пошукова функція використовується в вікі-системах пошуку документів. Практична її реалізація пов’язана із встановленням місцезнаходження документів, про існування яких користувачеві відомо на підставі мінімуму точних формальних ознак (вид документа, автор, назва, вихідні дані і т. ін.).

Оціночна функція виявляється у явній або опосередкованій оцінці автором повного, часткового або аспектного змісту первинного документа. Це допомагає вибрати з кола документів однорідної тематики саме ті, що цікавлять конкретного користувача [8; c.111-112].

Результатом кваліфіковано виконаного процесу анотування завжди є оцінка документа. Оціночні елементи при цьому можуть бути присутніми явно або опосередковано.

Явна оцінка несе в собі висновок анотатора щодо конкретного документа. Опосередковано анотатор оцінює документ вже тим, що обирає його з ряду інших та виділяє ті сторони документа, які вважає найважливішими для досягнення мети анотування.

Зокрема, в інформаційній діяльності анотація усвідомлюється як перший ступінь реферування документів, тобто викладу його короткого змісту (згортання інформації).

Процес написання анотації складається з трьох основних етапів: перший – підготовчий, передбачає оцінку інформаційної значущості документа на вибір виду його інформаційної характеристики; другий – основний, на якому проводиться аналіз змісту документів та виявлення основних інформаційних фрагментів тексту; третій – заключний, спрямований на узагальнення найбільш значущої інформації і написання тексту анотації [19; c.51-52].

У процесі аналізу документа (при потребі) бажано використовувати додаткову інформацію з вікі-систем про авторів, що подаються в кінці періодичних видань тощо. Такий підхід дасть анотатору відомості про видання та його автора, можливо про місце документа, що аналізується в науковому (художньому, професійно-виробничому) висвітленні теми тощо. Коло додаткових джерел і вирішення питання про достатнє їх залучення для загального бібліографічного аналізу залежить від складності теми документа, цільового і читацького призначення створюваної анотації.

Якщо це стаття з фахового чи художньо-літературного часопису, то слід одержати загальне уявлення про дане періодичне чи продовжуване видання (хто його видає, з якого часу, якою є його спрямованість чи основна тематика) і, при потребі, визначити місце даної публікації і самого автора серед інших робіт, що висвітлюють дане питання (тему чи проблему).

Під інформаційною структурою анотації розуміється набір інформаційних елементів. Зокрема, анотації на твори з суспільних, природничих, технічних наук містять такі інформаційні елементи: характеристику типу твору, основної теми (проблеми), об’єкта, мети роботи та її результатів; наголошується, що нового несе дана робота у порівнянні з іншими, близькими їй за тематикою і цільовим призначенням (при перевиданні – відмінність даного видання від попереднього); при необхідності подаються відомості про автора [7; c.63].

3. Мікроаналітична переробка інформації у вікі-системах

До мікроаналітичного згортання інформації відносяться: індексування, реферування, скорочений і повний переклади, аналітичний огляд.

Зупинимось на спеціальному вигляді згортання інформації – індексування документів та запитів.

Індексування – це процес відображення змісту документа і/або смислового значення інформаційного запиту інформаційно-пошуковою мовою у вікі-системах.

Результатом індексування документа є його пошуковий образ, що виражає основний зміст документа, тобто, який представляє собою набір індексів (лексичних одиниць) ІПМ, що відповідають основним предметам і аспектам змісту документа [20; c.122].

Результатом індексування запиту є його пошуковий образ, що виражає зміст інформаційного запиту, тобто, це сукупність понять про головні теми запиту, виражених термінами ІПМ.

Для того, щоб якісно здійснити процес індексування, необхідно зрозуміти сутність ІПМ.

ІПМ є основним елементом логіко-семантичного аппарата вікі-систем.

ІПМ – це формалізована штучна мова, що призначена для індексування документів, інформаційних запитів і опису фактів з метою послідуючого зберігання та пошуку.

Необхідність створення штучної мови для виразу смислового змісту інформації з метою її пошуку обумовлена тим, що природна мова, тобто мова, за допомогою якої ми спілкуємось, має такі властивості, котрі заперечують її використання для запису та пошуку інформації.

До таких властивостей головним чином відноситься неоднозначність та багатозначність термінів природної мови. Неоднозначність термінів виражається в синонімії, коли для вираження одного і того ж поняття використовуються різні слова. Неоднозначність та багатозначність термінів природної мови (омонімія, полісемія) не дозволяють визначити точної відповідності між змістом документа і засобами вираження його змісту.

Наприклад, лексична синонімія – формування, комплектування (фондів) і граматична синонімія – студенти, студентство. Багатозначність слів проявляється і в омонімії – лук – оружие, лук – растение, і т. п.

Необхідність створення штучної мови визначається і такою властивістю природної мови, як неформалізованість зв’язків слів у ній. Наприклад, слова: дерево, липа – не мають формальних ознак, що відображають їх родовидовий зв’язок і т. п. [11; c.244-245]

Труднощі використання природної мови, як ІПМ, обумовлені ще тим, що в вікі-системах використовуються як вхідні документи не повні тексти, а реферати, анотації, бібліографічні описи, котрі є результатом згортання змісту документів. При згортанні тексту документа зменшуються можливості визначення слів за їх контекстуальними відношеннями.

Перелічувані вище властивості природної мови і обумовили створення штучної ІПМ, основними вимогами до якої є: однозначність (тобто, кожен запис ІПМ повинен мати тільки одне змістовне значення, пояснення, однакову форму запису засобами ІПМ); достатня семантична сила (тобто, здатність відображати з необхідною повнотою та точністю смисловий зміст документів та запитів визначеної предметної області); відкритість (тобто, забезпечення можливості корегувати мову) [24; c.111].

Основні характеристики ІПМ:

  1. Семантична сила – здатність ІПМ виражати з необхідною повнотою та точністю смислове значення інформації, що обробляється.
  2. Лексична повнота та точність – характеризує стан словника ІПМ і відповідність його лексиці визначеної предметної області.
  3. Парадигматична повнота та точність – здатність ІПМ достатньо повно та точно відображати інформацію про предмети та поняття, що перебувають в постійних родовидових та інших парадигматичних відношеннях.
  4. Синтагматична повнота та точність – здатність ІПМ повно та точно відображати інформацію про ситуативні відношення, тобто відношення між предметами та поняттями, що виникають у контексті.

Предметизація базується на основі предметних класифікацій документів. Предметизація документів використовується при створенні предметних каталогів, картотек, абетково-предметних покажчиків, побудові предметних рубрик.

Основним поняттям предметизації є предмет.

ІПМ предметних рубрик створюється на основі природної мови, і пошукові образи документів представлені у вигляді предметних рубрик.

Лексика ІПМ може бути контрольованою (створення списків предметних рубрик конкретних вікі-систем (ІПС)) і неконтрольованою (коли здійснюється вільне формулювання предметних рубрик).

Слід зазначити, що предметизація характеризується великою кількістю інтуїтивних припущень і цілком природним є прагнення уникнути їх, що дає змогу не тільки зменшити суб’єктивізм у процесі предметизації, але й підвищити її якість [2; c.150-151].

Застосування методу типізації передбачає побудову всіх елементів вікі-систем предметизаційного типу відповідно до певних правил, що надає змогу уникнути суб’єктивізму в предметизації конкретних документів.

Необхідно зазначити, що предметизація завжди здійснюється відповідно до потреб конкретних споживачів інформації.

Необхідно зазначити, що велика кількість інформаційно-пошукових тезаурусів, які являють собою ІПМ дескрипторних вікі-систем, були створені на базі словників предметних рубрик, що відтворювали лексику конкретного предметного каталога.

Подальший розвиток предметизації тісно пов’язаний з розвитком координатного індексування. Мова предметних рубрик продовжує вдосконалюватись, орієнтуючись на потреби вікі-систем.

Систематизація документів – один із методів АСПІ, що відповідає потребам людей у розподілі знань за галузевою ознакою, диференціації наукових знань.

Під систематизацією розуміють визначення класифікаційного індексу документа відповідно до його змісту за таблицею певної системи класифікації. Слід відзначити, що при систематизації здійснюється переклад ознак змісту документів з природної мови на штучну мову класифікаційних індексів певної систематичної документної класифікації. Якість систематизації, точність визначених пошукових образів документів, а також якість вікі-систем, побудованих на основі систематичних класифікацій, залежить від якості і можливостей саме класифікацій.

Систематичні класифікації завжди будуються на основі класифікації наук. Класифікація наук визначає місце кожної науки в загальній системі наукових знань, зв’язків усіх наук. Система класифікації – це упорядкований перелік класів, підкласів і більш дрібних ділень, в основі якого лежить певна класифікація наук, і, виходячи з цього, визначається місце для кожної науки, теми, проблеми тощо [18; c.27].

Інформаційно-пошуковий тезаурус (ІПТ) – це нормативний словник дескрипторної ІПМ із зафіксованими в ньому парадигматичними відношеннями між лексичними одиницями. В інформаційній діяльності тезаурус використовується з метою заміни різних слів та словосполучень, що виражають одну і ту ж думку, одним словом або словосполученням – дескриптором.

ІПТ призначений для виконання наступних функцій: індексування документів і запитів, тобто перекладу їх змісту з природної мови на дескрипторну; фіксування парадигматичних відношень між дескрипторами, які розширюють можливості інформаційного пошуку.

Як і будь-який словник, ІПТ служить термінологічним посібником в різних галузях знання. Кожний конкретний ІПТ відображає систему понять визначеної галузі знання у вигляді структурованої сукупності термінів і є результатом роботи висококваліфікованих спеціалістів. У залежності від тематичного профілю, котрий визначає склад лексики, розрізняють: багатогалузеві, галузеві та вузькотематичні тезауруси.

Одномовні тезауруси – це ІПТ, що включають лексичні одиниці, які взяті з однієї природної мови.

Багатомовні тезауруси – це ІПТ, що включають лексичні одиниці, які взяті з декількох природних мов і представляють еквівалентні за смисловим значенням поняття кожною із цих мов [12; c.130-131].

Розглянемо більш детально етапи розробки ІПТ.

Словник – це масив термінів, що підлягає семантичній обробці в процесі дескрипторизації і формується шляхом вилучення із текстів первинних, а частіше вторинних документів, ключових слів, тобто в процесі індексування документів і запитів. Для набору термінології використовують рубрикатори, довідкову літературу, опитування спеціалістів, таблиці класифікацій.

На цьому етапі виникає проблема формулювання ключових слів. Ключове слово – це інформативне слово, що приведене до стандартної лексикографічної форми і котре використовується для координатного індексування. Відповідно до загальноприйнятих правил відносно різниці між ключовими та неключовими словами, прийнято:

– службові слова (прийменники, сполучники і т. п.) слід вважати неключовими;

– загальні терміни (метод, спосіб, опис і т. п.) необхідно використовувати тільки в сполученні з іншими словами, що конкретизують їх значення;

– полісемічні терміни входять тільки в тих значеннях, в яких вони використовуються в даній тематичній галузі [21; c.144].

Індексування – один із процесів мікроаналітичного згортання інформації.

Індексування документів – одна з найвідповідальніших процедур з обробки документів при введені їх до вікі-систем.

Індексування – це вираження змісту документа і/або смислового значення інформаційного запиту інформаційно-пошуковою мовою.

Залежно від ІПМ, яка використовується в пошукових масивах, документи підлягають обробці за такими видами індексування: предметизація, систематизація, координатне індексування.

Результатом індексування документів є складання пошукового образу документа (ПОД), тобто тексту, що передає основне значення змісту документа в термінах ІПМ, прийнятої у вікі-системах. Процедура індексування складається зі слідуючих взаємопов’язаних процесів: обстеження змісту документа та встановлення його предмета; ідентифікація основних понять, що складають предмет документа; відбір відповідних термінів індексування для представлення виявлених понять засобами обраної мови індексування і формування ПОД (ПОЗ).

Індексування запиту здійснюється шляхом перекладу його теми або предмета, що цікавить користувача, на прийняту в вікі-системах ІПМ.

У процесі індексування використовується термінологічна база, яка може бути представлена рубрикаторами предметних рубрик, схемами класифікацій, словниками дескрипторів (тезаурусами).

В залежності від цього є такі види індексування:

  • предметизація – предметне індексування засобами мови предметних рубрик. Предметне індексування – це індексування предметного змісту документів;
  • систематизація (класифікаційне індексування) – присвоєння даним або документам класифікаційних індексів відповідно до правил будь-якої класифікаційної ІПМ;
  • координатне індексування – індексування, що передбачає багатоаспектне викладення основного смислового змісту документа або смислового змісту інформаційного запиту більшістю ключових слів або дескрипторів.

Пошуковий образ при систематичному індексуванні задається правилами систематизації та є складним індексом, окремі компоненти якого об’єднані між собою за допомогою знаків (+) та (:).

Під складними індексами розуміють індекси, що створені сполученням основного індексу з загальним або спеціальним визначником, а також індекси, створені за допомогою апострофа та косої риски.

Порядок (послідовність) приєднання визначників (елементів) складного індексу відповідає смисловим відношенням між поняттями основного змісту документа і тому не може бути строго регламентований правилами індексування.

Досвід свідчить про таку послідовність приєднання визначників до основного індексу або спеціального визначника, що використовується як основний індекс: ’1/’9; .01/.09; .00…; -03 або -05; (0…); (…); “…” (=…). Тобто, на перше місце після знаків основного індексу ставиться спеціальний визначник з апострофом, потім з крапкою нуль .01/.09, потім – спеціальний визначник з дефісом -1/-9 [25; c.97-98].

ВИСНОВКИ

Аналітико-синтетична переробка документної інформації – це процеси перетворення інформації, що міститься в первинному документі, з метою створення вторинних документів. У цьому ж сенсі, зважаючи на застосування загальнонаукових методів аналізу й синтезу під час створення інформаційних документів, уживаються й інші терміни, наприклад, «наукова обробка документів», «аналітико-синтетична обробка документів», «інформаційний аналіз/синтез».

Процеси АСПІ можна розглядати з різних точок зору, різних навчальних дисциплін – це інформатика, бібліографія, каталогізація, всі вони містять у собі певні процеси АСПІ.

Аналітико-синтетична обробка включає операції аналізу та синтезу, багато спеціалістів вважає, що поняття, яке розглядається окрім названих процесів включає, здійснення наукового перекладу, створення бібліографічних покажчиків, списків інформаційних видань, фактографічних картотек та баз даних, оскільки при цьому не можливо обійтись без цих операцій.

Кожен вид АСПІ розглядається як процес (метод), за допомогою якого можна створити пошукові образи документів (ПОД) для введення інформаційних масивів вікі-системах; створення електронних каталогів (ЕК), баз даних (БД) різноманітних видів інформаційної продукції в електронному вигляді.

Слід зазначити, що в інформаційних масивах вікі-систем представлені не самі документи, а їх ПОД, бібліографічні описи, анотації, реферати, тобто вторинна інформація, тому основним призначенням АСПІ є створення вторинної інформації. АСПІ будується на використанні методів інформаційного аналізу й синтезу, має назву аналітико-синтетична переробка.

СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ

  1. Аналітико-синтетична обробка документів : підруч. для студ. ін-тів культури / Е. Т. Карачинська, Є. А. Медведєва, В. К. Удалова, Л. Г. Хромченко. – X. : ХДІК, 1996. – 258 с.
  2. Башмаков А. Интеллектуальные информационные технологии [Текст]: Учеб. пособие / Александр Игоревич Башмаков, Игорь Александрович Башмаков. – М.: Изд-во МГТУ им. Н.Э. Баумана, 2005. – 304 с.
  3. Бібліографічний запис. Бібліографічний опис. Загальні вимоги та правила складання : ДСТУ ГОСТ 7.1 : 2006 . – К. : Держстандарт України, 2007. – 48 с.
  4. Библиографическая запись. Библиографическое описание. Общие требования и правила составления: ГОСТ 7.1-2003. – М., 2004.
  5. Блюменау Д. Информационный анализ/синтез для формирования вторичных документов [Текст]: Практическое пособие / Д. И.Блюменау– СПб.: «Профессия», 2002. – 256 с.
  6. Власова Г. В. Аналітико-синтетична переробка інформації: навч. посіб. [Електронний ресурс] / Г. В. Власова, В. І. Лутовинова, Л. І. Титова. – К. : ДАКККіМ, 2006. – 291 с.
  7. Голубцов С. Средства менеджмента библиографической информации [Текст]: Учебно-методическое пособие / Станислав Брониславович Голубцов. – М.: ИВЭСЭП, 2009. – 84 с.
  8. Горбаченко Т. Г. Аналітико-синтетична переробка документної інформації : навч. посіб. / Т. Г. Горбаченко. – К. : Ун-т «Україна», 2004. – 236 с.
  9. Згуровський М. З. та ін. Вступ до комп’ютерних інформаційних технологій. – К.: Вид-во Європ. Ун-ту, 2000. – 256 с.
  10. Земсков A. Электронная информация и электронные ресурсы [Текст] / Андрей Земсков, Яков Шрайберг. – М.: ФАИР, 2007. – 528 с.
  11. Зупарова Л. Аналитико-синтетическая переработка информации [Текст] / Л. Б. Зупарова, Т. А. Зайцева; под ред. Ю.Н. Столярова. – М.: ФАИР, 2007. – 400 с.
  12. Інформаційні системи і технології [Електронний ресурс] : навч. посіб. / С. Г. Карпенко [та ін.]. – Електрон. дані. – К. : МАУП, 2004. –192. с.
  13. Інформація та документація. Базові поняття. Терміни та визначення : ДСТУ 2392–94. – К. : Держстандарт України, 1994. – 53 с.
  14. Карпенко О. О. Аналітико-синтетична переробка документної інформації: бібліографічний опис : навч. посіб. [Електронний ресурс] / О. О. Карпенко. – Х. : Нац. аерокосм. ун-т «ХАІ», 2008. – 70 с.
  15. Карпенко О. О. Документознавство : метод. рек. до виконання курсових робіт / О. О. Карпенко. – Х. : Нац. аерокосм. ун-т «ХАІ», 2007. – 27 c.
  16. Кушнаренко Н. Наукова обробка документів [Електронний ресурс]: Підручник / Наталя Миколаївна Кушнаренко, Валерія Костянтинівна Удалова. — 4-те вид., перероб. і доп. – К.: Знання, 2006. – 334 с.
  17. Ландэ Д. Поиск знаний в Internet [Текст]: Пер с англ. / Дмитрий Владимирович Ландэ. – М.: Издательский дом «Вильямс», 2005. – 272 с.
  18. Лутовинова В. І. Анотування як процес аналітико-синтетичної переробки інформації : метод. посіб. / В. Лутовинова. – X. : [б. н. ], 2003. – 44 с.
  19. Осауленко О.Г. Інформаційне забезпечення державного управління сталим розвитком / О.Г.Осауленко. – К., 2001. – 72 с.
  20. Предметизация документов // Справочник библиотекаря. – СПб., 2001.
  21. Романенко В. Сетевой информационный поиск [Текст]: Практическое пособие [Електронний ресурс] / Владимир Николаевич Романенко, Галина Васильевна Никитина. – СПб.: «Профессия», 2005. – 288 с.
  22. Силкова Г. В. Основи інформаційно-аналітичних досліджень: навч. посіб. / Г. В. Силкова. – Рівне : РІС КСУ, 1998. – 49 с.
  23. Слободяник М. Структура сучасного документознавства / М. Слободяник // Вісн. Кн. палати. – 2003. – № 4.
  24. Щербаков А. С. Индексирование документов ключевыми словами / А. С. Щербаков. – М. : [б. н.], 2003. – 221 с.
  25. Янхли Дж. Автоматизированное индексирование / Дж. Янхли. – М. : [б. н.], 2000. – 168 с.
  26. Про інформацію: Закон України // Відомості Верх. Ради України. – 1995. – №13. – с. 281-291.
  27. Про Національну програму інформатизації: Закон України // Голос України. – 1998. – 7 квіт. – с. 5-6.
  28. ГОСТ 7.1-84. Библиографическое описание документа. Общие требования и правила составления. – М., 1984. – 76 с.
  29. ГОСТ 7.9-77. Реферат и аннотация. Взамен ГОСТ 7.9-70. – М., 1977. – 5 с.
  30. UNIMARC MANUAL: Руководство по  UNIMARC  для библиографических данных: Фрагменты 2-го изд.: Измен. и допол. к 1-му изд. / Пер. с англ.; Под общ. Ред. Я.Л. Шрайберга. – М.: ГПНТБ России, 1995. – 52 с.