Математика

Физика

Химия

Биология

Техника и    технологии

Автоматическая обраеотка, хранение и поиск информации-Сэлтон Г.
Сэлтон Г. Автоматическая обраеотка, хранение и поиск информации. Нью-Йорк, 1968, Пер. о англ., под ред. А. И. Китова. М., «Сов. радио», 1973, 580 с.
Рассматривается широкий круг проблем автоматической обработки текстовой информации дри создании документальных и фактографических информационно-поисковых систем (ИПС), реализованных на ЭВМ. Наибольшее внимание в книге уделено машинным методам лингвистического анализа документов с использованием различных грамматических, статистических и семантических критериев, способам построения автоматических словарей и тезаурусов и формам их хранения в ЭВМ, схемам организации поисковых массивов, разнообразным методам автоматического поиска. Особый интерес представляют разделы книги, посвященные методам оценки эффективности различных способов автоматической обработки информации и построению теоретических моделей информационного поиска, базирующихся на использовании теоретико-множественных преобразований и структур графов.
Книга содержит много нового интересного материала по принципам построения полностью автоматизированных ИПС и предназначена для широкого круга специалистов, занимающихся разработкой и эксплуатацией систем обработки информации. Она может служить учебным пособием для студентов и аспирантов вузов.
175 рис., 80 таб., библ. 301 назв.
ПРЕДИСЛОВИЕ
Предлагаемая вниманию читателя книга Г. Сэлтона представляет собой монографию по вопросам теории и практики информационно-поисковых систем (ИПС), основанных на использовании естественных языков. Хотя в разработанной автором системе и приводимых в книге примерах обработки текстов используется английский язык, теоретические результаты и практические алгоритмы, а также способы организации информации в машинной памяти, применяемые при обработке текстовой информации, носят общий характер и будут, несомненно, полезны при построении ИПС, использующих другие естественные языки.
Основная ценность книги заключается, на наш взгляд, в достаточно глубокой теоретической и практической разработке методов статистического и семантического анализа текстов и в обосновании необходимости комплексного подхода к построению ИПС, использующих естественные языки. Заслуживают серьезного внимания приведенные в книге математические модели процессов поиска данных и анализа текстов. В книге излагаются наиболее современные подходы и идеи в области автоматической обработки текстовой информации, и в этом отношении она удачно восполняет пробел в нашей литературе.
Следует отметить, что книга Сэлтона не является традиционным курсом по информационно-поисковым системам. В частности, в ней почти не рассматриваются практически действующие ИПС, основанные на общеизвестных де-скрипторных и классификационных принципах. В ней упор делается на новые проблемы и методы, обсуждаются спорные вопросы и зачастую излагаются личные взгляды и научные результаты автора.
Перевод книги дается с некоторым сокращением, в основном, приложений и разделов, содержащих описания конкретных подпрограмм, так как эти описания представляют интерес для лиц, использующих соответствующее оборудование.
ОГЛАВЛЕНИЕ
Предисловие...................... 5
Предисловие автора................... 7
Глава 1. Автоматизированные информационные системы 12
1.1. Введение................... 12
1.2. Распространение информации........... 15
1.3. Поиск информации.............. 18
1.4. Автоматический анализ содержания....... 22
Список литературы ................. 34
Глава 2. Анализ информации и построение словаря . . 36
2.1. Введение................... 36
2.2. Анализ языка ................ 37
2.3. Структура словаря .............. 40
2.4. Характеристики словаря............ 57
2.5. Автоматическое построение тезауруса...... 67
2.6. Автоматическое составление иерархии...... 76
Список литертуры............... 85
Глава 3. Операции со словарем ............ 87
3.1. Введение................... 87
3.2. Представление структур и поиск информации 87
3.3. Алгоритмы поиска .............. 91
3.4. Операции с тезаурусом............ 102
3.5. Обработка статистических словосочетаний . . . 117
3.6. Операции с иерархической системой понятий . . 122
Список литературы............... 137
Глава 4. Статистические методы обработки....... 138
4.1. Введение................... 138
4.2. Статистические ассоциации терминов...... 141
4.3. Реализация ассоциативного поиска ...... 152
4.4. Оценка метода ассоциативного поиска..... 161
4.5. Автоматическая классификация........ 167
Список литературы .............. 186
Глава 5. Синтаксические операции........... 189
5.1. Введение................... 189
5.2. Автоматический анализ содержания документов 190
5.3. Синтаксис и семантика ............ 194
5.4. Эталонные словосочетания........... 208
5.5. Сравнение синтаксических деревьев....... 224
5.6. Оценка.................... 245
Список литературы............... 249
Г л а в а 6. Модели поиска............... 252
6.1. Введение................... 252
6.2. Основы теории множеств............ 253
6.3. Включающий информационный поиск...... 201
6.4. Системы, базирующиеся на классификации . . . 267
6.5. Использование отрицания........... 276
6.6. Модели поиска па оспове деревьев и графов . . . 279 Список литературы .............. 285
Глава 7. Поиск ................... 287
7.1. Введение................... 287
7.2. Критерий соответствия векторов терминов запросов и документов................. 288
7.3. Стратегия поиска и организации массива .... 296
7.4. Итеративные поиски на основе обратной связи . . 324
7.5. Адаптивный информационный поиск в реальном масштабе времени................ . 338
Список литературы .............. 341
/ Г л а в а 8. Оценка автоматизированных поисковых систем 343
8.1. Введение................... 343
» / 8.2. Условия проведения оценки.......... 344
/ v 8.3. Измерение полноты и точности.......... -347
/ ^Вт4т Методы" определения значения полноты..... 358
8.5. Представление результатов........... 361
8.6. Разработка автоматизированных информационных систем ...................... 386
8.7. Общие выводы................ 423
Список литературы .............. 426
Глава 9. Вопросы вспомогательного информационного
обслуживания................. . . 428
9.1. Введение................... 428
9.2. Специализированное оборудование....... 429
9.3. Автоматизация подготовки исходных данных . . 433
9.4. Переработка текстов ............. 440
9.5. Выпуск указателей и глоссариев........ 449
9.6. Составление указателей библиографических ссылок. 487
9.7. Избирательное рапределеыие информации .... 470 Списоклитературы............... 474
Г л а в а 10. Фактографические поисковые системы .... 477
10.1. Введение ,................. 477
10.2. Обращение с простыми массивами данных . . . 479
10.3. Поисковые языки .............. 481
10.4. Автоматические системы, отвечающие на вопросы 489
10.5. Информационно-поисковые системы, работающие
в реальном масштабе времени........... 511
Список литературы ............... 519
Приложение. Описание системы ^МАДТ...... 522
П.1. Введение................... 522
П.2. Краткое описание работы системы....... 523
П.З. Ведущая программа системы ......... 529
П.4. Рабочие программы ............. 533
П.5. Подготовка данных.............. 548
Список литературы.............. 557
Предметный указатель............. 558

Цена: 150руб.

Назад

Заказ

На главную страницу

Hosted by uCoz