Архитектура параллельных вычислительных систем - davaiknam.ru o_O
Главная
Поиск по ключевым словам:
Похожие работы
Название работы Кол-во страниц Размер
Вычислительные машины, комплексы и компьютерные сети Архитектура... 1 76kb.
Архитектура вычислительных систем 1 179.55kb.
Классификация информационно-вычислительных сетей 1 209.46kb.
Ванторин В. Д механизмы приборных и вычислительных систем 1 7.59kb.
Программа вступительного экзамена в магистратуру по направлению подготовки... 1 90.31kb.
«Введение. Принципы построения операционных систем» 5 424.87kb.
Теория функционирования распределенных вычислительных систем 1 21.6kb.
Аннотация программы учебной дисциплины 1 66.45kb.
О. В. Непомнящий, И. В. Кочан, К. В. Кондратьев, В. А. Митюков 1 184.36kb.
Программа по курсу: современные технологии параллельного программирования... 1 63.42kb.
Федеральное государственное бюджетное 1 197.57kb.
Вопросы к государственному экзамену по специальности 30 2412.98kb.
Направления изучения представлений о справедливости 1 202.17kb.

Архитектура параллельных вычислительных систем - страница №1/16

ОГЛАВЛЕНИЕ

Введение 3

1.Архитектура параллельных вычислительных систем 6

1.1.Параллелизм в работе ЭВМ 6

1.2.Уровни параллелизма 6

1.3.Микроуровневый параллелизм 9

1.4.Параллелизм на уровне команд 12



1.4.1.Векторный процессор 13

1.4.2.Структура векторного процессора 14

1.4.3.Матричные процессоры 16

1.4.4.Архитектура VLIW 18

1.5.Параллелизм уровня потоков и уровня заданий 22



1.5.1.Архитектура SPMD 23

1.6.Потоковая архитектура (data flow) 26

1.7.Выводы 28

2.Описание архитектуры высокопараллельной вычислительной системы 29

2.1.Организация потоковой обработки информации 29

2.2.Построение программ коммутации 34

2.3.Программирования ветвящихся структур 39

2.4.Виртуализация ресурса 42

2.5.Индексация и выполнение векторных операций 44

2.6.Алгоритмы коммутации и выполнения команд 49

2.7.Система команд 51

2.7.1.Арифметические операции 53

2.7.2.Логические операции 53

2.7.3.Операции отношения 54

2.7.4.Условные арифметические операции 54

2.7.5.Команды передачи управления 55

2.7.6.Операции индексации 57

2.7.7.Операции пересылки и преобразований 57

2.7.8.Векторные операции 58

2.8.Выполнение системных операций 59

2.9.Устройства потоковой вычислительной системы 60

2.9.1.Выполнение команд процессором 60

2.9.2.Формирование физических адресов вычислителей 68

2.9.3.Процессор памяти 73

2.9.4.Информационное взаимодействие устройств 78

2.10.Выводы 82

3.Имитационная модель ПВС 83

3.1.Архитектура имитационной модели ПВС 83

3.2.Модуль режима программирования 84

3.3.Модуль режима визуализации процесса работы ПВС 86

3.4.Модуль проверки синтаксиса написанной пользователем программы 87

3.5.Модуль справочной системы 87

3.6.Модуль имитации работы ПВС 88

3.6.1.Архитектура модуля имитации работы ПВС 88

3.6.2.Память команд 89

3.6.3.Процессор коммутации 90

3.6.4.Вычислительное поле 90

3.6.5.Генерация адресов 90

3.6.6.Подсистема оперативной памяти данных 90

3.6.7.Подсистема доступа к оперативной памяти данных 90

3.7.Демонстрация работы имитационной модели 91

3.8.Выводы 93

4.ЭКОНОМИЧЕСКАЯ ЧАСТЬ 95

4.1.Задачи и назначение работы 95

4.2.Определение затрат на создание программного продукта 96



4.2.1.Расходы на оплату труда разработчика программы 96

4.2.2.Расчёт трудоёмкости создания программного продукта 96

4.2.3.Расчёт средней зарплаты программиста 98

4.2.4.Затраты на оплату машинного времени 98

4.2.5.Расчёт общих расходов и затрат на создание программного продукта 101

4.3. Выводы 102

Заключение 103

Литература 105





Введение


Актуальность темы диссертации.

Первый одноядерный микропроцессор (Intel 4004) был представлен 15 ноября 1971 г. корпорацией Intel. Он содержал 2300 транзисторов, работал на тактовой частоте 108 кГц и стоил $300.

Требования к вычислительной мощности центрального микропроцессора постоянно росли и продолжают расти. Производителям процессоров приходится постоянно подстраиваться под насущные и вечно растущие запросы пользователей ПК.

Долгое время повышение производительности традиционных одноядерных процессоров в основном происходило за счет последовательного увеличения тактовой частоты (около 80% производительности процессора определяла именно тактовая частота) с одновременным увеличением количества транзисторов на одном кристалле. Однако дальнейшее повышение тактовой упирается в ряд фундаментальных физических барьеров (поскольку технологический процесс почти вплотную приблизился к размерам атома: сегодня процессоры выпускаются по 22-нм технологии, а размеры атома кремния – приблизительно 0,543 нм):

• во-первых, с уменьшением размеров кристалла и с повышением тактовой частоты возрастает ток утечки транзисторов. Это ведет к повышению потребляемой мощности и увеличению выброса тепла;

• во-вторых, преимущества более высокой тактовой частоты частично сводятся на нет из-за задержек при обращении к памяти, так как время доступа к памяти не соответствует возрастающим тактовым частотам;

• в-третьих, для некоторых приложений традиционные последовательные архитектуры становятся неэффективными с возрастанием тактовой частоты из-за так называемого «фон-неймановского бутылочного горлышка» – ограничения производительности в результате последовательного потока вычислений. При этом возрастают резистивно-емкостные задержки передачи сигналов, что является дополнительным узким местом, связанным с повышением тактовой частоты.

Следовательно, необходимо добиваться повышения производительности другими средствами, отличными от повышения тактовой частоты больших монолитных ядер. Решением является принцип «разделяй и властвуй» – разделение задачи на множество одновременных операций и их распределение между множеством небольших вычислительных устройств.

Организация принципа «разделяй и властвуй» при помощи многопроцессорных систем также не получила широкого распространения, так как требовала сложных и дорогостоящих многопроцессорных материнских плат. Поэтому производителями микропроцессоров было принято решение добиваться дальнейшего повышения производительности другими средствами. Самым эффективным направлением была признана концепция многопоточности, зародившаяся в мире суперкомпьютеров, – это одновременная параллельная обработка нескольких потоков команд.

Так в недрах компании Intel родилась Hyper-Threading Technology (HTT) – технология сверхпоточной обработки данных, которая позволяет процессору выполнять в одноядерном процессоре параллельно до четырех программных потоков одновременно. Hyper-threading значительно повышает эффективность выполнения ресурсоемких приложений (например, связанных с аудио- и видеоредактированием, 3D-моделированием), а также работу ОС в многозадачном режиме.

Процессор Pentium 4 с включенным Hyper-threading имеет одно физическое ядро, которое разделено на два логических, поэтому операционная система определяет его, как два разных процессора (вместо одного).

Hyper-threading фактически стала трамплином к созданию процессоров с двумя физическими ядрами на одном кристалле. В 2-ядерном чипе параллельно работают два ядра, которые при меньшей тактовой частоте обеспечивают большую производительность, поскольку параллельно выполняются два независимых потока инструкций.

В итоге, в настоящее время наращивание мощностей многопроцессорных вычислительных систем (МВС) идет в основном по пути увеличения числа вычислительных узлов (ВУ) в кластерах архитектуры MPP (Massively Parallel Processing, системы с локальной памятью). Пока мощность МВС увеличивается в основном интенсивным путем (рост числа отдельных ВУ и/или ядер), однако ресурс интенсивного роста, естественно, небезграничен.

Томас Стерлинг (профессор Луизианского университета, создатель кластерной технологии Beowulf), постулирует наличие «точки Стерлинга» – фундаментального ограничения производительности традиционных архитектур вычислителей. По мнению Стерлинга, следует рассматривать новые подходы к организации вычислений и архитектуры вычислителей. Он, в частности, предлагает заинтересоваться концепцией управления вычислениями потоком данных – data flow, идеей перемещения кода к данным (а не наоборот, как это принято сейчас).

Создание компьютеров с применением потоковых процессоров вряд ли реально при современных технологиях. Однако развитие аппаратной базы идет огромными темпами, так сценарий создания высокопараллельной вычислительной системы на основе потоковой архитектуры принципиально возможен. Следовательно, тема выпускной квалификационной работы актуальна не только в настоящее время, но и в ближайшем будущем.

Цель выпускной квалификационной работы.

Целью выпускной квалификационной работы являются моделирование и оценка характеристик высокопараллельной вычислительной системы потоковой архитектуры (data flow). Исходя из поставленной цели, в работе решаются следующие задачи:



  • анализ способов использования параллельности в архитектуре

  • разработке модели потоковой вычислительной системы

  • программная реализация разработанной модели потоковой вычислительной системы

  • оценка влияния значений варьируемых параметров разработанной модели на время выполнения задач

  • оценка возможности применения ВС потоковой архитектуры для нераспараллеливаемых задач.

Предмет исследования.

Предметом исследования являются вычислительные системы потоковой архитектуры и способы их организации.



Методы исследования.

  • имитационное моделирование

  • системное программирование

  • теория языков программирования

Научная новизна. Научную новизну выпускной квалификационной работы составляют результаты, полученные в ходе решения поставленных задач:

  • система команд разработанной модели потоковой вычислительной системы

  • модель потоковой вычислительной системы, основанная на принципах dataflow

  • оценка влияния варьируемых параметров разработанной модели на время выполнения задач.

Практическая ценность работы.

Практическая ценность работы заключается в:



  • разработанном инструментальном средстве, предназначенном для оценки влияния значений варьируемых параметров на время выполнения задач

  • разработанном программном продукте, визуально демонстрирующим процесс работы высокопараллельной вычислительной системы потоковой архитектуры.

Апробация результатов исследований.

Основные результаты, полученные в ходе выполнения выпускной квалификационной работы, докладывались на международной молодежной научной конференции ХХХVIII Гагаринские чтения (Москва, 2012 г.), а также были опубликованы на сайте Института инженеров по электротехнике и электронике – IEEE. Предложенная модель ВС потоковой архитектуры получила первую премию в номинации «Лучшая архитектура» в соревновании «2010 IEEE Computer Society Student Competition».



следующая страница >>



Квартира: помещение, в котором после выключения телевизора вы убеждаетесь, что слушали телевизор соседа. Леонард Луис Левинсон
ещё >>