Математика | ||||
Анализ информационно поисковых систем-ч.мидоу Москва 1970 стр.363 | ||||
Анализ информационно поисковых систем-ч.мидоу Москва 1970 стр.363
Книга посвящена вопросам теории и практики информационного поиска и создания эффективных информационно-поисковых систем с использованием современных средств автоматики и вычислительной техники. В 10 главах книги подробно рассмотрены вопросы выбора информационно-поисковых языков и систем индексирования информации, построения поисковых образов, организации и хранения информационных массивов, организации систем массивов, планирования и стратегии поиска, оценки поисковых ошибок, обработки и обслуживания информационных массивов и эффективности функционирования информационно-поисковых систем. Книга может служить введением в новую область знаний —«информатику». Она окажется полезной специалистам, интересующимся проблемами организации информационной службы, инженерам и научным работникам, занятым разработкой автоматизированных информационно-поисковых систем. Книга может также служить учебным пособием для студентов соответствующих специальностей. ПРЕДИСЛОВИЕ Циркуляция больших потоков научно-технической информации привела к созданию информационной службы, задача которой заключается в том, чтобы помочь исследователю или специалисту в его научно-информационной работе, избавив от необходимости тратить очень дорогое (в прямом смысле!) время на весьма утомительное и трудоемкое выискивание интересующих его публикаций в океане научно-технической литературы. В течение определенного периода информационные работники еще довольствовались в своей деятельности методами и средствами смежных научных дисциплин, но с увеличением числа исследователей и информационных потоков, с появлением множества межотраслевых проблем, с усложнением информационных запросов исследователей и более жесткими временными ограничениями перед информационной службой возникла задача значительного повышения эффективности своей деятельности. А это потребовало глубокого изучения специфики научно-информационной деятельности, вскрытия присущих ей закономерностей и т. п., т. е. создания новой научной дисциплины — информатики, основным объектом изучения которой является научно-информационный процесс во всем его многообразии и сложности, а основной задачей — повышение эффективности научно-информационной связи между специалистами. Если попытаться раскрыть понятие «информатики», то можно сказать, что предметом информатики являются процессы, способы и закономерности фиксирования (записи), аналитико-синтетиче-ской переработки, хранения, поиска и распространения научной информации (но не сама научная информация, которая есть атрибут соответствующей науки или научной дисциплины). Иными словами, предметом информатики является изучение общих явлений и закономерностей научно-информационной деятельности, но не сама эта деятельность, которую могут и должны выполнять лишь специалисты в соответствующих отраслях науки и техники. Несмотря на то что информатика еще не вышла из стадии своего формирования, уже определился ряд направлений, по которым проводятся исследования информационной деятельности. Сюда могут быть отнесены прежде всего вопросы общего характера, ОГЛАВЛЕНИЕ Предисловие Предисловие автора ЧАСТЬ I. ИНФОРМАЦИОННЫЙ ПОИСК И СВЯЗЬ 19 Глава 1 . ВВЕДЕНИЕ ....... ...................... *9 1.1. Информационный поиск как процесс связи ..... 19 1.1.1. Понятие информации ............. 19 1.1.2. Передача информации ....... ...... 21 1.1.3. Библиотека как коммутационный центр ... 25 1.2. Процесс информационного поиска .......... 27 Глава 2. ИНФОРМАЦИОННО-ПОИСКОВЫЕ языки ........... 32 2.1. Введение ...................... 32 2.2. Характерные признаки информационно-поисковых языков ....................... 35 2.2.1. Общая природа информационно-поисковых языков 35 2.2.2. Требования к информационно-поисковым языкам 35 2.2.3. Структура информационно-поисковых языков . . 37 2.2.4. Меры эффективности информационно-поисковых языков .................... 39 2.3. Обзор информационно-поисковых языков ...... 41 2.3.1. Иерархическая классификация ........ 41 2.3.2. Предметные заголовки ............ 45 2.3.3. Системы ключевых слов ........... 51 2.3.4. Языки с синтаксисом .......... ... 56 2.4. Логика информационно-поисковых языков ...... ' 63 2.5. Сравнительный анализ информационно-поисковых языков 71 2.5.1. Семантическая сила ............ . . 73 2.5.2. Многозначность ................ 74 2.5.3. Компактность • ..... ........... 76 2.5.4. Стоимость выбора терминов .......... 77 2.6. Словари ...... ................ 79 2.6.1. Необходимость использования словаря .... 79 2.6.2. Роль словаря ................ 82 2.6.3. Типы словарей ................ 85 2.6.4. Пример словаря ............... 90 Глава 3. СОЗДАНИЕ поисковых ОБРАЗОВ ............... 94 3.1. Введение ...................... 94 3.2. Принципы построения поисковых образов ...... 97 3.2.1. Типы терминов и дескрипторов ........ 98 3.2.2. Точка зрения на индексировапие ..... . . 99 3.2.3. Широта и глубина индексирования ....... 102 3.2.4. Правила выражения содержания в поисковом образе .................... 103 3.2.5. Примеры правил индексирования ....... 106 3.3. Использование структуры документа при индексировании ........ ............... 109 3.3.1. Словарный состав ............ ... 109 3.3.2. Синтаксис .................. 112 3.3.3. Формат ................... 113 3.4. Статистический выбор индексирующих терминов . . . 119 3.4.1. Основные параметры..... 3.4.2. Общие слова и значимые слова 3.4.3. Теория значимости слов . . . Глава 4. ОТЫСКАНИЕ поисковых ОБРАЗОВ; , 4.1. Введение................... 4.2. Принципы поиска .............. 4.2.1. Выборка информации.......... 4.2.2. Формулирование поискового предписания 4.2.3. Перевод поискового предписания .... 4.2.4. Поиск и сопоставление......... 4.2.5. Релевантность............. 4.3. Планирование поиска .........' . . . 4.3.1. Усиление запроса ........... 4.3.2. Промежуточные данные ........ 4.4. Эффективность поисковой системы....... 4.4.1. Ошибки поиска'............ 4.4.2. Причины возникновения ошибок .... 4.4.3. Влияние ошибок при поиске...... 4.4.4. Требования к эффективности системы . . 4.4.5. Оценка опшбок............. 4.4.6. Оценка себестоимости.......... 4.4.7. Интенсивность использования ..... 4.4.8. Поиск и комплектование фондов .... 4.4.Й- Оценка стоимости............ 4.5. Использование полученной информации .... 4.5.1. Информация и доверие......... 4.5.2. Циклический поиск .......... ЧАСТЬ II. ОРГАНИЗАЦИЯ ИНФОРМАЦИИ Глава 5. ОРГАНИЗАЦИЯ ЗАПИСЕЙ............... 5.1. Введение............... 5.2. Принципы организации записей .... 5.2.1. Структура записи ....... 5.2.2. Семантическая сила ...... 5.2.3. Позиционная многозначность . . 5.2.4. Семантическая многозначность 5.2.5. Компактность записи...... 5.3. Последовательность структур записей . 5.3.1. Инвариантная структура .... 5.3.2. Двоично-позиционное кодирование 5.3.3. Фиксированные поля...... 5.3.4. tПовторяющиеся поля...... 5.3.5.'Помеченные поля........ 5.3.6. Фразы............. 5.3.7. Естественный язык....... 5.3.8. Случайное,упорядочение..... 5.3.9. Комбинированные структуры . . 5.4. Краткие выводы ........... 5.4.1. Семантическая сила....... 5.4.2. Позиционная многозначность . . 5.4.3. Семантическая многозначность . . 5.4.4. Компактность ......... 367 Глава 6. ОРГАНИЗАЦИЯ МАССИВОВ ................... 218 6.1. Введение...................... 218 6.2. Обработка массива и поиск данных......... 218 6.3. Роль запоминающей среды при организации массива 220 6.3.1. Баланс между чтением и записью....... 220 6.3.2. Доступ к информации............ 222 6.3.3. Уровни доступности .............. 224 6.4. Принципы организации массивов.......... 227 6.4.1. Распределение данных ............ 228 6.4.2. Упорядочение записей ............ 232 6.4.3. Размещение записей ............. 236 6.4.4. Влияние используемых схем поиска на организацию массивов ................ 237 6.4.5. Краткие выводы............... 239 6.5. Методы организации массивов........... 239 6.5.1. Последовательно-смежное размещение записей . . 240 6.5.2. Цепная организация массива......... 240 6.5.3. Организация массива с ветвящейся структурой 243 6.5.4. Списковые структуры.............. 248 Глава 7. ХРАНЕНИЕ и ИЗМЕРЕНИЕ СТРУКТУРНОЙ ИНФОРМАЦИИ 254 7.1. Введение...................... 254 7.2. Основные понятия теории информации........ 255 7.2.1. Что такое информация?............ 255 7.2.2. Измерение информации......,..... 256 7.2.3. Шум..................... 26Ф 7.3. Представление информации о структуре массива . . . 261 7.3.1. Табличное представление........... 262 7.3.2. Формульное представление.......... 264 7.3.3. Хранение информации в неявном виде..... 267 7.4. Измерение информации о структуре массива..... 268 7.4.1. Измерение информации о значениях символов 268 7.4.2. Измерение информации о последовательности символов .................... 270 7.4.3. Сравнение методов^ представления информации 272 Глава 8. ОРГАНИЗАЦИЯ НАБОРОВ МАССИВОВ............. 280 8.1. Введение..................... 280 8.2. Принципы организации наборов массивов...... 280 8.2.1. Типы массивов................ 281 8.2.2. Соображения относительно последовательности поиска.................... 283 8.2.3. Факторы сравнения............. 284 8.3. Поиск с фиксированной последовательностью .... 286 8.3.1. Набор из одного массива........... 286 8.3.2. Использование словаря............ 288 8.3.3. Использование структурного массива..... 291 8.4. Инвертированный поисковый массив......... 292 8.4.1. Использование инвертированного массива . . . 294 , 8-4.2. Достоинства и недостатки........... 296 9.4.3. Пример системы............... 298 8.5. Поиск с изменяемой последовательностью....... 301 368 ОГЛАВЛЕНИЕ ЧАСТЬ III. ОБРАБОТКА МАССИВОВ И НАБОРОВ МАССИВОВ 312 Глава 9. Основные операции над массивами......... 312 9.1. Введение...................... 312 9.2. Упорядочение массива ............... 313 9.3. Слияние.................... . 315 9.4. Сортировка..................... 317 9.4.1. Сортировка при последовательных слияниях 318 9.4.2. Внутренняя сортировка............ 320* 9.4.3. Использование упорядоченности данных при сортировке................... 324 9.5. Поиск....................... 326 9.5.1. Принципы поиска .............. 327 9.5.2. Основные виды плана поиска......... 229 9.5.3. Оценка времени............... 330 9.6. Пакетная (групповая) обработка данных.......• 334 Глава 10. Обработка массивов................. 339 10.1. Введение...................... 339 10.2. Принципы обработки массивов........... 339 10.2.1. Виды операций над массивами........ 340 10.2.2. Взаимосвязь между обработкой и поиском ... 341 10.3. Примеры операций по обработке массивов...... 343 10.3.1. Обработка набора из одного массива..... 343 10.3.2. Обработка с использованием инвертированного поискового массива.............. . 344 10.3.3. Проблемы обработки словаря......... 347 10.3.4. Косвенные затраты при обработке массивов 350 10.4. Краткие выводы.................. 351 Глоссарий............................ 353 Алфавитный указатель....................... 358 Цена: 150руб. |
||||