Математика

Физика

Химия

Биология

Техника и    технологии

Параллельные вычислительные системы-Корнев Москва 1999 стр.311
Параллельные вычислительные системы-Корнев Москва 1999 стр.311

СОДЕРЖАНИЕ
Аннотация............................................................................10
Введение..............................................................................11
Глава 1.
Организация когерентности многоуровневой
иерархической памяти...........................................................16
1.1 Архитектура вычислительных систем................................16
1.2 Механизмы неявной реализации когерентности.............18
1.2.1 Однопроцессорный подход..................................................19
1.2.2 Многопроцессорный подход...............................................21
1.2.2.1. Сосредоточенная память.....................................................21
1.2.2.2. Физически распределенная память...................................23
1.2.3 Особенности реализации алгоритма когерентности..........25
1.3 Механизм явной реализации когерентности....................26
1.4 Реализация коммуникационной среды.............................26
Глава 2.
Коммуникационные среды.....................................................29
2.1 Коммуникационная среда на основе
масштабируемого когерентного интерфейса SCI..................29
2.1.1 Основные характеристики..................................................29
2.1. .1 Происхождение....................................................................29
2.1. .2 Механизм когерентности....................................................29
2.1. .3 Предназначение...................................................................30
2.1. .4 Структура коммуникационных сред на базе SCI..............30
2.1. .5 Физическая реализация.......................................................32
2.1. .6 Обозначение каналов..........................................................32
2.1.2 Логическая структура SCI...................................................33
2.1.2.1 Транзакции..........................................................................33
2.1.2.2 Исполнение транзакций.....................................................34
2.1.2.3 Транзакции записи и чтения..............................................35
.2.4 Транзакция пересылки........................................................35
.2.5 Транзакции блокировки......................................................35
.2.6 Транзакция прерывания.....................................................36
.2.7 Транзакция передачи сообщений......................................36
2.1.3 Архитектура SCI..................................................................36
.3.1 Структура адресного пространства....................................36
.3.2 Регистоы упоавления и состояния.....................................36
2.1.3.3 Форматы пакетов.................................................................37
2.1.4 Когерентность кэш-памятей...............................................38
2.1.4.1 Организация распределенной директории........................38
2.1.4.2 Протокол когерентности....................................................38
2.1.5 Функциональная организация узла SCI............................39
2. .5.1 Структура узла.....................................................................39
2. .5.2 Пакеты и свободные символы__.......................................40
2. .5.3 Прием пакетов..............................................................;......40
2. .5.4 Передача пакетов.................................................................41
2. .5.5 Управление потоком............................................................41
2.1.6 Реализация SCI фирмы Dolphin Interconnect Solutions....42
2.1.6.1 Набор СБИС........................................................................42
2.1.6.2. Предлагаемый фирмой Dolphin набор
оборудования для построения кластеров......................................44
2.1.7. Реализация GigaRing Channel фирмы Cray Research........44
2.2 Коммуникационная среда MYRINET...............................46
2.2.1 Основные характеристики..................................................46
2.2.1.1 Структура среды..................................................................46
2.2.1.2 Адаптер «шина компьютера - линк сети».........................47
2.2.1.3 Коммутаторы.......................................................................47
2.2.2 Маршрутизация..............:....................................................48
2.2.2.1 Общая организация.............................................................48
2.2.2.2 Логический уровень............................................................49
2.2.2.3 Приливно-отливный буфер................................................50
2.2.2.4 Начальные установки..........................................................51
2.2.3 Физическая реализация.......................................................51
2.3 Коммуникационная среда kaceway...................................53
2.3.1 Общие сведения...................................................................53
2.3.1.1 Происхождение....................................................................53
2.3.1.2 Предназначение...................................................................53
2.3.2 Кристалл Cypress CY7C965 Raceway Crossbar....................53
2.3.2.1 Структура среды..................................................................53
2.3.2.2 Форматы данных.................................................................54
2.3.2.3 Маршрутизация...................................................................54
2.3.2.4 Функции управляющих линий...........................................57
2.3.2.5 Управляющие сигналы, общие для всех портов...............58
2.3.3 Структуры коммутаторов типа "толстое дерево"..............58
2.4. Коннектор шин PCI: SRC 3266 DE -
Sebring Ring Connection for PCI..............................................60
2.4.1. Описание возможностей.....................................................60
2.4.2. Структура и функционирование........................................61
2.4.3. Архитектура SRC.................................................................63
2.5 Memory Channel фирмы DEC......................,.....................65
2.5.1 Архитектура..........................................................................65
2.5.2 Аппаратура МС....................................................................68
2.5.3 Протокол линка МС2........................................................69
2.6 Коммуникационные среды на базе транспьютероподобных микропроцессоров............................69
2.6.1 Транспьютерная технология...............................................69
2.6.2. Передача данных в транспьютерных системах
фирмы Inmos................................................................................70
2.6.2.1. Транспьютеры первого поколения....................................70
2.6.2.2. Протокол обмена в транспьютере второго
поколения Т-9000...........................................................................73
2.6.3 Коммуникационная среда на базе сигнального микропроцессора TMS 320 С4х..................................................77
2.6.3.1 Происхождение....................................................................77
2.6.3.2 Организация линков...........................................................77
2.6.3.3 Синхронизация между CPU, DMA и портами.................80
2.6.4 Коммуникационная среда на базе ADSP AD2106X..........80
2.6.4.1 Общая характеристика........................................................80
2.6-А2 Организация линков...........................................................81
2.6.4.3 Асинхронный «запрос-ответ».............................................82
2.6.4.4 Буферы..................................................................................82
2.6.4.5 Установление согласия по использованию линка............83
2.6.4.6 Интерфейс с хост-компьютером.......................................83
2.6.4.7 Обнаружение ошибок при передаче..................................84
2.6.4.8 Начальная загрузка памяти ADSP 2106х...........................84
2.6.5. Заключительные замечания...............................................84
2.7. Телекоммуникационные технологии.................................85
2.7.1. Основные направления развития.......................................85
2.7.2. FDDI....................................................................................86
2.7.3. lOOVG-AnyLan.....................................................................86
2.7.4. ATM..............................................................................-........87
2.7.5. Fibre Channel....................................:.......................;...........87
2.8. Архитектура Next Generation I/O фирмы Intel.................87
2.9. Сравнительный анализ коммуникационных сред............89
2.9.1. Доступность для коммерческого использования...............89
2.9.2. Реализация протоколов.......................................................89
2.9.3. Пропускная способность и задержка.................................90
2.9.4. Характеристики, учитываемые при выборе коммуникационной среды для ВС.............................................91
Глава 3.
Коммутаторы вычислительных систем ..................................92
3.1. Простые коммутаторы........................................................93
3.1.1. Простые коммутаторы с временным разделением...........93
3.1.1.1. Алгоритмы арбитража........................................................94
2.1.1.2. Особенности реализации шин..........................................96
2.1.1.3. Недостатки шинных структур............................................97
3.1.2. Простые коммутаторы с пространственным разделением98
3.2. Составные коммутаторы.....................................................99
3.2.1. Коммутатор Клоза.............................................................100
3.2.2. Баньян-сети.......................................................................101
3.3. Распределенные составные коммутаторы.......................103
3.3.1. Критерии выбора графов межмодульных связей............105
3.3.2. Графы с минимальным диаметром..................................106
•••'-'' •'• f^?%fi$i$jjmj№;
3.3.3. Кубические графы.............................................................110
3.4. Графы с определенными на них гомоморфизмами........ 111
3.4 J. Граф межмодульных связей Convex Exemplar
SPP 1000.....................................................................................112
3.4.2. Структура МВС-100..........................................................113
Глава 4.
Системы совместно протекающих взаимодействующих процессов...........................................................................117
4.1. Процессы и критические секции..................................... 117
4.1.1. Программные средства порождения процессов..............117
4.1.2. Синхронизация процессов и совместное использование ресурсов.............................................................119
4.2. Реализация взаимного исключения.................................120
4.3. Синхронизирующие примитивы......................................121
4.4. Синхронизация процессов посредством семафоров......122
4.4. Условные критические интервалы..................................126
4.6. Мониторы..........................................................................127
4.7. Замечание по использованию систем синхронизации ..128
4.8. Дедлоки и защита от них.................................................. 129
Глава 5.
Параллельное программирование для МРР систем..............134
5.1. Развитие параллельного программирования..................134
5.2. Организация эффективных параллельных вычислений ... 135
5.2.1. Масштабирование и переносимость: проблемы перехода от последовательных программ к параллельным.....135
5.2.2. Решение системы линейных уравнений
методом Гаусса без выбора ведущего элемента •.......................138
5.2.3. Проблемы организации параллельных вычислений.......143
5.3 Параллельные и распределенные базы данных.............144
5.3.1. Мотивация создания параллельных
и распределенных баз данных...................................................144
5.3.2. Реляционные базы данных...............................................144
5.3.3. Виды параллельной обработки в базах данных...............146
^44 ГТаТЧГ.ТТТТЛТ" ж-------------------
______----г.»~~.ж^« JJ WU-JCI
5.3.4. Параллельное выполнение операций..............................148
5.3.5. Построение параллельных баз данных............................152
5.4. Стандарт интерфейса передачи сообщений MPI...........153
^41 К<ЮЛТ" »л *-«-----------
5.4.1. Базовые понятия................................................................153
5.4.2. Управление группой..........................................................153
5.4.3. Процедуры парных межпроцессных обменов.................155
' 5.4.4. Коллективные взаимодействия процессов......................156
5.4.5. Средства поддержки MPI библиотек...............................159
5.5. Стандарт Open MP............................................................159
5.5.1. Основные положения стандарта.......................................159
5.5.2. Управляющие структуры...................................................159
5.5.3. Окружения данных............................................................160
5.5.4. Синхронизация..................................................................160
5.5.5. Библиотека времени исполнения.....................................161
5.6. Примеры программирования........................................... 161
5.7. Управление ресурсами параллельной системы..............163
5.8. Операционная системы КОСМОС..................................164
Глава 6.
Кластеры и массово параллельные системы
различных производителей..................................................169
6.1. Положение на рынке параллельных систем...................169
6.1.1. Основные производители параллельных систем.............169
6.1.2. Современные микропроцессоры......................................169
6.1.3. Требования к вычислительным компонентам информационных систем...........................................................173
6.1.4. Выбор процессорных плат................................................174
6.2. Реализация SMP Power Challenge
фирмы Silicon Graphics...........................................................175
6.2.1. Архитектурные особенности..............................................175
6.2.2. Протокол когерентности...................................................176
6.2.3. Функционирование шины.................................................177
6.2.4. Используемые средства повышения производительности.....179
6.2.5. Синхронизация параллельных процессов.........................179
6.2.6. Программное обеспечение................................................180
6.3. Семейство SUN Ultra Enterprise фирмы SUN.................181
6.3.1. Архитектурные особенности..............................................181
6.3.2. Коммутатор.........................................................................181
6.3.3. Идентификация системных модулей и начальная загрузка..... 181
6.3.4. Тактирование ВС................................................................182
6.3.5. Программное обеспечение.................................................182
6.4. Серверы фирмы NCR семейств World Mark...................183
6.4.1. Архитектура серверов NCR World Mark 4300..................183
6.4.2. Архитектура семейства серверов World Mark 5100..........185
6.4.2.1. Симметричный мультипроцессор....................................185
6.4.2.2. Кластеры............................................................................186
6.4.2.3. Массово параллельные системы......................................186
6.4.3. Программное обеспечение................................................188
6.4.3.1. Операционные системы....................................................188
6.4.3.2. СУБД..................................................................................190
6.4.3.3. Система поддержки отказоустойчивой работы...............191
6.4.3.4. Масштабируемая среда для распределенных вычислений TOP END.................................................................193
6.5. ВС с разделяемой распределенной памятью фирм SEQUENT и DATA GENERAL.............................................196
6.5.1. Принципы построения.....................................................196
6.5.2. Архитектура ВС NUMA-Q2000 фирмы SEQUENT.........196
6.5.3. IQ-линк..............................................................................198
6.5.3.1. Функциональная схема IQ-линка...................................198
6.5.3.2. Подсистема шины модуля...............................................199
6.5.3.3. Подсистема коммуникационной среды..........................100
r».-j~~ D-— w—••--'• —
„_____«-,..„. 711п.чс1чтл1пии среды..........................199
6.5.4. Orion Bus Interface Controller (OBIC)..............................200
6.5.5. SCI Cache Link Interface Controller (SCLIC)...................200
6.5.6. Контроллер линков SCI - Data Pump...............................201
6.5.7. Обслуживание промаха в кэш SCI.................. ">ni
/: с n -"i
________. .^^,,.1чли о 14.JU1 k3V^I...................................201
6.5.8. Суперсерверы фирмы Data General..........'........................202
, 6.6. Современные кластеры DIGITAL................................... 202
6.6.1.TruCluster..........................................................•..................202
6.6.2. DIGITAL Clusters for Widows NT.....................................204
6.7. Самые высокопроизводительные суперкомпьютеры.....204
6.7.1. Суперкомпьютеры программы ускоренной стратегической компьютерной инициативы ASCI..................204
6.7.2. Коммерческие суперкомпьютеры Cray T3E-900,......;.....206
6.7.3. Суперкомпьютер с многопотоковой
архитектурой МТА фирмы Тега................................................207
6.8. Вычислительные системы, собираемые пользователями из компонент высокой степени готовности.........................208
6.8.1. Побудительные мотивы сборки пользователями суперкомпьютеров......................................................................208
6.8.2. Программное обеспечение................................................209
6.8.3. Вычислительные кластеры с распределенной
памятью Beowulf и Avalon.........................................................212
6.9 Семейство массово параллельных ВС МВС-100
и МВС-1000.............................................................................214
6.9.1. Архитектура........................................................................214
6.9.2. Организация параллельных вычислений в МВС-100.....216
Глава 7.
Надежность и производительность
параллельных систем..........................................................221
7.1. Отказоустойчивые системы..............................................221
7.1.1. Основные понятия в области отказоустойчивости.........221
7.1.2. Основные подходы к обеспечению отказоустойчивости....................................................................222
7.1.3. Системы высокой готовности.................. /"л
Т 1 л V*
________,. .vivunisbin ..........................................230
7.1.4. Различные модели отказоустойчивых систем..................230
7.1.5. Отказоустойчивые системы на базе стандартных компонентов...............................................................................232
7.2. Оценка производительности ВС......................................235
7.2.1. Пиковая производительность ВС.....................................235
7.2.2. Реальная производительность..........................................237
7.2.3. Способы измерения реальной производительности.......238
7.2.4. Тесты Linpack.....................................................................239
7.2.5. Пакеты тестовых программ SPEC XX..............................240
7.2.6. Пакеты тестовых программ ТРС......................................245
7.2.7. Замечания о методах оценки производительности.........246
Глава 8.
Реализация ассоциативных и нейросетевых алгоритмов
на массово параллельных системах.....................................247
8.1. Общие подходы к ассоциативной обработке
данных на параллельной ВС..................................................247
8.1.1. Необходимость расширения проблемной
ориентации массово параллельных систем .:............................247
8.1.2. Разрыв в быстродействии процессоров и памяти
как препятствие повышению производительности ВС...........248
8.1.3. Ассоциативный способ обработки...................................248
8.2. Проект САМ 2000 — ассоциативной, контекстно адресуемой памяти..................................................................249
8.2.1. Идея проекта......................................................................249
8.2.2. Архитектура кристалла САМ 2000...................................250
8.2.3. Процессор ячейка-листа...................................................254
8.2.4. Процессор дерево..............................................................260
8.2.5. Оценка производительности.............................................263
8.3. Нейросетевые вычислительные системы........................264
8.3.1. Проблемная специализация нейросетевых вычислительных систем.............................................................264
8.3.2. Основные понятия теории искусственных
нейронных сетей........................................................................265
8.3.2.1. Типы нейросетей..............................................................265
8.3.2.2. Алгоритмы обучения многоуровневых персептронных сетей....................................................................271
8.3.2.3. Алгоритмы обучения сетей с радиусными
базисными функциями................................................................273
8.3.2.4. Замечания по поводу формирования нейронной сети.... 275
8.3.3. Аппаратные средства, интерпретирующие алгоритмы, заданные нейронной сетью.......................................................276
8.3.3.1. Подходы к аппаратной реализации................................276
8.3.3.2. Нейрочипы........................................................................278
8.3.3.3. Нейросетевые платы — ускорители
и нейрокомпьютеры.....................................................................281
8.4. Заключительные замечания о создании массово параллельных систем для реализации ассоциативных
и нейросетевых алгоритмов....................................................281
Приложение 1. ТОР 500 (17 ноября 1998)..........................282
Приложение 2. Список показателей SPEC 95......................287
Приложение 3..................................................................... 297
Литература.........................................................................299
Предметный указатель........................................................305

Цена: 150руб.

Назад

Заказ

На главную страницу

Hosted by uCoz