Математика | ||||
Параллельные вычислительные системы-Корнев Москва 1999 стр.311 | ||||
Параллельные вычислительные системы-Корнев Москва 1999 стр.311
СОДЕРЖАНИЕ Аннотация............................................................................10 Введение..............................................................................11 Глава 1. Организация когерентности многоуровневой иерархической памяти...........................................................16 1.1 Архитектура вычислительных систем................................16 1.2 Механизмы неявной реализации когерентности.............18 1.2.1 Однопроцессорный подход..................................................19 1.2.2 Многопроцессорный подход...............................................21 1.2.2.1. Сосредоточенная память.....................................................21 1.2.2.2. Физически распределенная память...................................23 1.2.3 Особенности реализации алгоритма когерентности..........25 1.3 Механизм явной реализации когерентности....................26 1.4 Реализация коммуникационной среды.............................26 Глава 2. Коммуникационные среды.....................................................29 2.1 Коммуникационная среда на основе масштабируемого когерентного интерфейса SCI..................29 2.1.1 Основные характеристики..................................................29 2.1. .1 Происхождение....................................................................29 2.1. .2 Механизм когерентности....................................................29 2.1. .3 Предназначение...................................................................30 2.1. .4 Структура коммуникационных сред на базе SCI..............30 2.1. .5 Физическая реализация.......................................................32 2.1. .6 Обозначение каналов..........................................................32 2.1.2 Логическая структура SCI...................................................33 2.1.2.1 Транзакции..........................................................................33 2.1.2.2 Исполнение транзакций.....................................................34 2.1.2.3 Транзакции записи и чтения..............................................35 .2.4 Транзакция пересылки........................................................35 .2.5 Транзакции блокировки......................................................35 .2.6 Транзакция прерывания.....................................................36 .2.7 Транзакция передачи сообщений......................................36 2.1.3 Архитектура SCI..................................................................36 .3.1 Структура адресного пространства....................................36 .3.2 Регистоы упоавления и состояния.....................................36 2.1.3.3 Форматы пакетов.................................................................37 2.1.4 Когерентность кэш-памятей...............................................38 2.1.4.1 Организация распределенной директории........................38 2.1.4.2 Протокол когерентности....................................................38 2.1.5 Функциональная организация узла SCI............................39 2. .5.1 Структура узла.....................................................................39 2. .5.2 Пакеты и свободные символы__.......................................40 2. .5.3 Прием пакетов..............................................................;......40 2. .5.4 Передача пакетов.................................................................41 2. .5.5 Управление потоком............................................................41 2.1.6 Реализация SCI фирмы Dolphin Interconnect Solutions....42 2.1.6.1 Набор СБИС........................................................................42 2.1.6.2. Предлагаемый фирмой Dolphin набор оборудования для построения кластеров......................................44 2.1.7. Реализация GigaRing Channel фирмы Cray Research........44 2.2 Коммуникационная среда MYRINET...............................46 2.2.1 Основные характеристики..................................................46 2.2.1.1 Структура среды..................................................................46 2.2.1.2 Адаптер «шина компьютера - линк сети».........................47 2.2.1.3 Коммутаторы.......................................................................47 2.2.2 Маршрутизация..............:....................................................48 2.2.2.1 Общая организация.............................................................48 2.2.2.2 Логический уровень............................................................49 2.2.2.3 Приливно-отливный буфер................................................50 2.2.2.4 Начальные установки..........................................................51 2.2.3 Физическая реализация.......................................................51 2.3 Коммуникационная среда kaceway...................................53 2.3.1 Общие сведения...................................................................53 2.3.1.1 Происхождение....................................................................53 2.3.1.2 Предназначение...................................................................53 2.3.2 Кристалл Cypress CY7C965 Raceway Crossbar....................53 2.3.2.1 Структура среды..................................................................53 2.3.2.2 Форматы данных.................................................................54 2.3.2.3 Маршрутизация...................................................................54 2.3.2.4 Функции управляющих линий...........................................57 2.3.2.5 Управляющие сигналы, общие для всех портов...............58 2.3.3 Структуры коммутаторов типа "толстое дерево"..............58 2.4. Коннектор шин PCI: SRC 3266 DE - Sebring Ring Connection for PCI..............................................60 2.4.1. Описание возможностей.....................................................60 2.4.2. Структура и функционирование........................................61 2.4.3. Архитектура SRC.................................................................63 2.5 Memory Channel фирмы DEC......................,.....................65 2.5.1 Архитектура..........................................................................65 2.5.2 Аппаратура МС....................................................................68 2.5.3 Протокол линка МС2........................................................69 2.6 Коммуникационные среды на базе транспьютероподобных микропроцессоров............................69 2.6.1 Транспьютерная технология...............................................69 2.6.2. Передача данных в транспьютерных системах фирмы Inmos................................................................................70 2.6.2.1. Транспьютеры первого поколения....................................70 2.6.2.2. Протокол обмена в транспьютере второго поколения Т-9000...........................................................................73 2.6.3 Коммуникационная среда на базе сигнального микропроцессора TMS 320 С4х..................................................77 2.6.3.1 Происхождение....................................................................77 2.6.3.2 Организация линков...........................................................77 2.6.3.3 Синхронизация между CPU, DMA и портами.................80 2.6.4 Коммуникационная среда на базе ADSP AD2106X..........80 2.6.4.1 Общая характеристика........................................................80 2.6-А2 Организация линков...........................................................81 2.6.4.3 Асинхронный «запрос-ответ».............................................82 2.6.4.4 Буферы..................................................................................82 2.6.4.5 Установление согласия по использованию линка............83 2.6.4.6 Интерфейс с хост-компьютером.......................................83 2.6.4.7 Обнаружение ошибок при передаче..................................84 2.6.4.8 Начальная загрузка памяти ADSP 2106х...........................84 2.6.5. Заключительные замечания...............................................84 2.7. Телекоммуникационные технологии.................................85 2.7.1. Основные направления развития.......................................85 2.7.2. FDDI....................................................................................86 2.7.3. lOOVG-AnyLan.....................................................................86 2.7.4. ATM..............................................................................-........87 2.7.5. Fibre Channel....................................:.......................;...........87 2.8. Архитектура Next Generation I/O фирмы Intel.................87 2.9. Сравнительный анализ коммуникационных сред............89 2.9.1. Доступность для коммерческого использования...............89 2.9.2. Реализация протоколов.......................................................89 2.9.3. Пропускная способность и задержка.................................90 2.9.4. Характеристики, учитываемые при выборе коммуникационной среды для ВС.............................................91 Глава 3. Коммутаторы вычислительных систем ..................................92 3.1. Простые коммутаторы........................................................93 3.1.1. Простые коммутаторы с временным разделением...........93 3.1.1.1. Алгоритмы арбитража........................................................94 2.1.1.2. Особенности реализации шин..........................................96 2.1.1.3. Недостатки шинных структур............................................97 3.1.2. Простые коммутаторы с пространственным разделением98 3.2. Составные коммутаторы.....................................................99 3.2.1. Коммутатор Клоза.............................................................100 3.2.2. Баньян-сети.......................................................................101 3.3. Распределенные составные коммутаторы.......................103 3.3.1. Критерии выбора графов межмодульных связей............105 3.3.2. Графы с минимальным диаметром..................................106 •••'-'' •'• f^?%fi$i$jjmj№; 3.3.3. Кубические графы.............................................................110 3.4. Графы с определенными на них гомоморфизмами........ 111 3.4 J. Граф межмодульных связей Convex Exemplar SPP 1000.....................................................................................112 3.4.2. Структура МВС-100..........................................................113 Глава 4. Системы совместно протекающих взаимодействующих процессов...........................................................................117 4.1. Процессы и критические секции..................................... 117 4.1.1. Программные средства порождения процессов..............117 4.1.2. Синхронизация процессов и совместное использование ресурсов.............................................................119 4.2. Реализация взаимного исключения.................................120 4.3. Синхронизирующие примитивы......................................121 4.4. Синхронизация процессов посредством семафоров......122 4.4. Условные критические интервалы..................................126 4.6. Мониторы..........................................................................127 4.7. Замечание по использованию систем синхронизации ..128 4.8. Дедлоки и защита от них.................................................. 129 Глава 5. Параллельное программирование для МРР систем..............134 5.1. Развитие параллельного программирования..................134 5.2. Организация эффективных параллельных вычислений ... 135 5.2.1. Масштабирование и переносимость: проблемы перехода от последовательных программ к параллельным.....135 5.2.2. Решение системы линейных уравнений методом Гаусса без выбора ведущего элемента •.......................138 5.2.3. Проблемы организации параллельных вычислений.......143 5.3 Параллельные и распределенные базы данных.............144 5.3.1. Мотивация создания параллельных и распределенных баз данных...................................................144 5.3.2. Реляционные базы данных...............................................144 5.3.3. Виды параллельной обработки в базах данных...............146 ^44 ГТаТЧГ.ТТТТЛТ" ж------------------- ______----г.»~~.ж^« JJ WU-JCI 5.3.4. Параллельное выполнение операций..............................148 5.3.5. Построение параллельных баз данных............................152 5.4. Стандарт интерфейса передачи сообщений MPI...........153 ^41 К<ЮЛТ" »л *-«----------- 5.4.1. Базовые понятия................................................................153 5.4.2. Управление группой..........................................................153 5.4.3. Процедуры парных межпроцессных обменов.................155 ' 5.4.4. Коллективные взаимодействия процессов......................156 5.4.5. Средства поддержки MPI библиотек...............................159 5.5. Стандарт Open MP............................................................159 5.5.1. Основные положения стандарта.......................................159 5.5.2. Управляющие структуры...................................................159 5.5.3. Окружения данных............................................................160 5.5.4. Синхронизация..................................................................160 5.5.5. Библиотека времени исполнения.....................................161 5.6. Примеры программирования........................................... 161 5.7. Управление ресурсами параллельной системы..............163 5.8. Операционная системы КОСМОС..................................164 Глава 6. Кластеры и массово параллельные системы различных производителей..................................................169 6.1. Положение на рынке параллельных систем...................169 6.1.1. Основные производители параллельных систем.............169 6.1.2. Современные микропроцессоры......................................169 6.1.3. Требования к вычислительным компонентам информационных систем...........................................................173 6.1.4. Выбор процессорных плат................................................174 6.2. Реализация SMP Power Challenge фирмы Silicon Graphics...........................................................175 6.2.1. Архитектурные особенности..............................................175 6.2.2. Протокол когерентности...................................................176 6.2.3. Функционирование шины.................................................177 6.2.4. Используемые средства повышения производительности.....179 6.2.5. Синхронизация параллельных процессов.........................179 6.2.6. Программное обеспечение................................................180 6.3. Семейство SUN Ultra Enterprise фирмы SUN.................181 6.3.1. Архитектурные особенности..............................................181 6.3.2. Коммутатор.........................................................................181 6.3.3. Идентификация системных модулей и начальная загрузка..... 181 6.3.4. Тактирование ВС................................................................182 6.3.5. Программное обеспечение.................................................182 6.4. Серверы фирмы NCR семейств World Mark...................183 6.4.1. Архитектура серверов NCR World Mark 4300..................183 6.4.2. Архитектура семейства серверов World Mark 5100..........185 6.4.2.1. Симметричный мультипроцессор....................................185 6.4.2.2. Кластеры............................................................................186 6.4.2.3. Массово параллельные системы......................................186 6.4.3. Программное обеспечение................................................188 6.4.3.1. Операционные системы....................................................188 6.4.3.2. СУБД..................................................................................190 6.4.3.3. Система поддержки отказоустойчивой работы...............191 6.4.3.4. Масштабируемая среда для распределенных вычислений TOP END.................................................................193 6.5. ВС с разделяемой распределенной памятью фирм SEQUENT и DATA GENERAL.............................................196 6.5.1. Принципы построения.....................................................196 6.5.2. Архитектура ВС NUMA-Q2000 фирмы SEQUENT.........196 6.5.3. IQ-линк..............................................................................198 6.5.3.1. Функциональная схема IQ-линка...................................198 6.5.3.2. Подсистема шины модуля...............................................199 6.5.3.3. Подсистема коммуникационной среды..........................100 r».-j~~ D-— w—••--'• — „_____«-,..„. 711п.чс1чтл1пии среды..........................199 6.5.4. Orion Bus Interface Controller (OBIC)..............................200 6.5.5. SCI Cache Link Interface Controller (SCLIC)...................200 6.5.6. Контроллер линков SCI - Data Pump...............................201 6.5.7. Обслуживание промаха в кэш SCI.................. ">ni /: с n -"i ________. .^^,,.1чли о 14.JU1 k3V^I...................................201 6.5.8. Суперсерверы фирмы Data General..........'........................202 , 6.6. Современные кластеры DIGITAL................................... 202 6.6.1.TruCluster..........................................................•..................202 6.6.2. DIGITAL Clusters for Widows NT.....................................204 6.7. Самые высокопроизводительные суперкомпьютеры.....204 6.7.1. Суперкомпьютеры программы ускоренной стратегической компьютерной инициативы ASCI..................204 6.7.2. Коммерческие суперкомпьютеры Cray T3E-900,......;.....206 6.7.3. Суперкомпьютер с многопотоковой архитектурой МТА фирмы Тега................................................207 6.8. Вычислительные системы, собираемые пользователями из компонент высокой степени готовности.........................208 6.8.1. Побудительные мотивы сборки пользователями суперкомпьютеров......................................................................208 6.8.2. Программное обеспечение................................................209 6.8.3. Вычислительные кластеры с распределенной памятью Beowulf и Avalon.........................................................212 6.9 Семейство массово параллельных ВС МВС-100 и МВС-1000.............................................................................214 6.9.1. Архитектура........................................................................214 6.9.2. Организация параллельных вычислений в МВС-100.....216 Глава 7. Надежность и производительность параллельных систем..........................................................221 7.1. Отказоустойчивые системы..............................................221 7.1.1. Основные понятия в области отказоустойчивости.........221 7.1.2. Основные подходы к обеспечению отказоустойчивости....................................................................222 7.1.3. Системы высокой готовности.................. /"л Т 1 л V* ________,. .vivunisbin ..........................................230 7.1.4. Различные модели отказоустойчивых систем..................230 7.1.5. Отказоустойчивые системы на базе стандартных компонентов...............................................................................232 7.2. Оценка производительности ВС......................................235 7.2.1. Пиковая производительность ВС.....................................235 7.2.2. Реальная производительность..........................................237 7.2.3. Способы измерения реальной производительности.......238 7.2.4. Тесты Linpack.....................................................................239 7.2.5. Пакеты тестовых программ SPEC XX..............................240 7.2.6. Пакеты тестовых программ ТРС......................................245 7.2.7. Замечания о методах оценки производительности.........246 Глава 8. Реализация ассоциативных и нейросетевых алгоритмов на массово параллельных системах.....................................247 8.1. Общие подходы к ассоциативной обработке данных на параллельной ВС..................................................247 8.1.1. Необходимость расширения проблемной ориентации массово параллельных систем .:............................247 8.1.2. Разрыв в быстродействии процессоров и памяти как препятствие повышению производительности ВС...........248 8.1.3. Ассоциативный способ обработки...................................248 8.2. Проект САМ 2000 — ассоциативной, контекстно адресуемой памяти..................................................................249 8.2.1. Идея проекта......................................................................249 8.2.2. Архитектура кристалла САМ 2000...................................250 8.2.3. Процессор ячейка-листа...................................................254 8.2.4. Процессор дерево..............................................................260 8.2.5. Оценка производительности.............................................263 8.3. Нейросетевые вычислительные системы........................264 8.3.1. Проблемная специализация нейросетевых вычислительных систем.............................................................264 8.3.2. Основные понятия теории искусственных нейронных сетей........................................................................265 8.3.2.1. Типы нейросетей..............................................................265 8.3.2.2. Алгоритмы обучения многоуровневых персептронных сетей....................................................................271 8.3.2.3. Алгоритмы обучения сетей с радиусными базисными функциями................................................................273 8.3.2.4. Замечания по поводу формирования нейронной сети.... 275 8.3.3. Аппаратные средства, интерпретирующие алгоритмы, заданные нейронной сетью.......................................................276 8.3.3.1. Подходы к аппаратной реализации................................276 8.3.3.2. Нейрочипы........................................................................278 8.3.3.3. Нейросетевые платы — ускорители и нейрокомпьютеры.....................................................................281 8.4. Заключительные замечания о создании массово параллельных систем для реализации ассоциативных и нейросетевых алгоритмов....................................................281 Приложение 1. ТОР 500 (17 ноября 1998)..........................282 Приложение 2. Список показателей SPEC 95......................287 Приложение 3..................................................................... 297 Литература.........................................................................299 Предметный указатель........................................................305 Цена: 150руб. |
||||