Распределенные алгоритмы
Категория реферата: Рефераты по информатике, программированию
Теги реферата: налоги и налогообложение, план дипломной работы
Добавил(а) на сайт: Ноздрин.
Предыдущая страница реферата | 4 5 6 7 8 9 10 11 12 13 14 | Следующая страница реферата
Физический (1) уровень. Цель физического уровня в стандартах IEEE
подобна таковому первоначального стандарта МЕЖДУНАРОДНОЙ ОРГАНИЗАЦИИ ПО
СТАНДАРТИЗАЦИИ, а именно передавать последовательности битов. Фактические
стандартные описания (тип монтажа и т.д.), однако, радикально различны, вследствие того, что вся связь происходит через общедоступную среду, а не
через двухточечные подключения.
Medium-access-control подуровень (2a). Цель этого подуровня состоит в
том, чтобы решить конфликты, которые возникают между узлами, которые хотят
использовать общедоступную среду связи. Статичный подход раз и навсегда
планировал бы интервалы времени, в течение которых каждому узлу позволяют
использовать среду. Этот метод теряет много пропускной способности, однако, если только несколько узлов имеют данные, чтобы передавать, и все другие
узлы тихи, среда остается в простое в течение времен, планируемых для тихих
узлов. В шинах маркера и эстафетных кольцах доступ к среде находится по
карусельному принципу: узлы циркулируют привилегию, названную маркером, среди них, и узлу, задерживающему этот маркер, позволяют использовать
среду. Если узел, задерживающий маркер, не имеет никаких данных, чтобы
передать, он передает маркер к следующему узлу. В эстафетном кольце
циклический порядок, в котором узлы получают их право хода, определен
физической топологией подключения (который, действительно, кольцо), в то
время как в шине маркера, циклический порядок определен динамически
основываясь на порядке адресов узлов. В стандарте МНОЖЕСТВЕННОГО ДОСТУПА С
ОПРОСОМ НЕСУЩЕЙ И РАЗРЕШЕНИЕМ КОНФЛИКТОВ узлы наблюдают, когда среда
неактивна, и если так, то им позволяют послать. Если два или больше узла
запускают посылку (приблизительно) одновременно, имеется проверка на
пересечение, которое обнаруживается, что заставляет каждый узел прерывать
передачу и пытаться снова в более позднее время.
Logical-link-control подуровень (2b). Цель этого уровня сравнима с целью канального уровня в OSI модели, а именно: управлять обменом данными между узлами. Уровень обеспечивает управление ошибками и управление потоком данных, используя методы, подобные тем использованных в OSI протоколах, а именно числа последовательности и подтверждения. Видящийся с точки зрения более высоких уровней, logical-link-control подуровень появляется подобно сетевому уровню OSI модели. Действительно, связь между любой парой узлов происходит без того, чтобы использовать промежуточные узлы, и может быть обработана непосредственно logical-link-control подуровнем. Отдельный сетевой уровень не следовало бы выполнять в локальных сетях; вместо этого, транспортный уровень сформирован непосредственно на верхней части logical- link-control подуровня.
1.2.4 Поддержка Языка
Реализация одного из программных уровней сети связей или распределенной прикладной программы требует, чтобы распределенный алгоритм, используемый в том уровне или прикладной программе был кодирован на языке программирования. На фактическое кодирование конечно высоко влияет язык и особенно примитивы, которые он предлагает. Так как в этой книге мы концентрируемся на алгоритмах и не на их кодировании как программа, наша базисная модель процессов основана на состояниях процесса и переходах состояния (см. Подраздел 2.1.2), а не на выполнении команд, принимаемых из предписанного набора. Конечно, неизбежно, чтобы там, где мы представили алгоритмы, требовалась некоторая формальная запись; запись программирования, используемая в этой книге обеспечена в Приложении A. В этом подразделе мы описываем некоторые из конструкций, которые можно наблюдать в фактических языках программирования, разработанных для распределенных систем. Мы ограничиваемся здесь кратким описанием этих конструкций; Для большего количества деталей и примеров фактических языков, которые используют различные конструкции, см., например, Bal [Bal90]. Язык для программирования распределенных прикладных программ, должен обеспечить средства, чтобы выразить параллелизм, обрабатывать взаимодействие, и недетерминизм. Параллелизм, конечно, требуется для программирования различных узлов системы таким способом, которым узлы выполнят их часть программы одновременно. Связь между узлами должна также быть поддержана в соответствии с языком программирования. Недетерминизм необходим, потому что узел должен иногда быть способен получить сообщение от различных узлов, или быть способным либо посылать, либо получать сообщение.
Параллелизм. Наиболее соответствующая степень параллелизма в
распределенной прикладной программе зависит от отношения(коэффициента)
между стоимостью связи и стоимостью вычисления. Меньшая степень
параллелизма учитывает более быстрое выполнение, но также и требует
большего количества связи, так, если связь дорога, усиление в
быстродействии вычисления может быть потеряно в дополнительной стоимости
связи. Параллелизм обычно выражается, определением нескольких процессов, где каждый процесс является последовательным объектом с собственным
пространством состояния. Язык может или предлагать возможность статического
определения совокупности процессов или позволять динамическое создание и
завершение процессов. Также возможно выразить параллелизм посредством
параллельных инструкций или в функциональном языке программирования.
Параллелизм не всегда явен в языке; выделение разделов кода в параллельные
процессы может выполняться сложным транслятором.
Связь. Связь между процессами свойственна распределенным системам: если
процессы не связываются, каждый процесс функционирует в изоляции от других
процессов и должен изучаться в изоляции, a не как часть распределенной
системы. Когда процессы сотрудничают в вычислении, связь необходима, если
один процесс нуждается в промежуточном результате, произведенном другим
процессом. Также, синхронизация необходима, потому что вышеупомянутый
процесс должен быть приостановлен, пока результат не доступен. Прохождение
cообщения затрагивает, и связь и синхронизацию; общедоступная память
затрагивает только связь: дополнительная осторожность должна быть
предусмотрена для синхронизации процессов, которые сообщаются c
использованием общедоступной памяти. В языках, которые обеспечивают
передачу сообщения, доступны операции "посылать" и "получать". Связь
происходит выполнением посылающейся операции в одном процессе
(следовательно названным процессом отправителя) и получающейся операцией в
другом процессе (процесс приемника). Параметры посылающей операции - адрес
приемника и дополнительные данные, формирующие содержание сообщения. Эти
дополнительные данные становятся доступными приемнику, когда получающая
инструкция выполнена, то есть, таким образом осуществляет связь. Получающая
операция может быть завершена только после того, как посылающая операция
была выполнена, что и осуществляет синхронизацию. В некоторых языках
получающая операция не доступна явно; вместо этого, процедура или операция
активизируется неявно, когда сообщение получено. Язык может обеспечивать
синхронное прохождение сообщения, когда посылающая операция завершена
только после выполнения получающей операции.
Другими словами, отправитель блокирован, пока сообщение не было получено, и имеет место двухсторонняя синхронизация между результатами приемника и отправителем. Сообщения могут быть посланы двухточечно, то есть, от одного отправителя на один приемник, или широковещательно, когда то же самое сообщение получено всеми приемниками. Термин мультиприведение также используется, чтобы обратиться к сообщениям, которые посланы совокупности (не обязательно всех) процессов. Несколько более структурированный примитив связи - удаленный вызов процедуры (RPC). Чтобы связываться с процессом b, процедура a обращается к процедуре, представленной в процессе b, посылая параметры процедуры в сообщении; а приостанавливается, пока результат процедуры не будет возвращен в другом сообщении. Вариант для прохождения сообщения - использование общедоступной памяти для связи; один процесс пишет значение переменной, и другой процесс читает значение. Синхронизация между процессами тяжелее, чтобы ее достигнуть, потому что чтение переменной может быть использовано прежде, чем переменная была записана. При использовании примитивов синхронизации типа семафоров [Dij68] или мониторов [Hoa78], возможно выполнить передачу сообщения, в среде общедоступных переменных. И наоборот, также возможно выполнить (виртуальную) общедоступную память в передающей сообщения среде, но это очень неэффективно.
Недетерменизм. В многих точках в выполнении процесс может быть способен
продолжиться различными способами. Получающая операция часто
недетерминирована, потому что это позволяет получение сообщений от
различных отправителей. Дополнительные способы выражать недетерменизм
основаны на охраняемых командах. Охраняемая команда в наиболее общей форме
- список инструкций, каждый предшествованный булевым выражением (его
защитником). Процесс может продолжать выполнение с любой из инструкций, для
которых соответствующая защита оценивается истиной. Защита может содержать
получающую операцию, когда она оценивается истиной, если имеется сообщение, доступное, чтобы быть полученным.
1.3 Распределенные Алгоритмы
Предыдущие разделы дали причины для использования распределенных
компьютерных систем и объяснили характер этих систем; потребность
программировать эти системы возникает как следствие. Программирование
распределенных систем должно быть основано на использовании правильных, гибких, и эффективных алгоритмов. В этом разделе обсуждается, что
разработка распределенных алгоритмов - ремесло, совершенно различное по
характеру от ремесла, используемого в разработке централизованных
алгоритмов. Распределенные и централизованные системы отличаются по ряду
существенных отношений, обрабатываемых в Подразделе 1.3.1 и иллюстрируемых
в 1.3.2 Подразделе. Распределенное исследование алгоритмов следовательно
развилось как независимое поле научного исследования; см. 1.3.3 Подраздел.
Эта книга предназначена, чтобы представить читателю это поле исследования.
Цели книги и выбора результатов, включенных в книгу установлены в
Подразделе 1.3.4.
1.3.1 Распределенный против Централизованных Алгоритмов
Распределенные системы отличаются от централизованных компьютерных систем по трем существенным отношениям, которые мы теперь обсуждаем.
(1) Недостаток знания глобального состояния. В централизованных
решениях управление алгоритмом может быть сделано основанным на наблюдениях
состояния системы. Даже при том, что к всему состоянию обычно нельзя
обращаться в одиночной машинной операции, программа может осматривать
переменные один за другим, и принимать решение, в конце концов релевантная
информация будет расценена. Никакие данные не изменяются между проверкой и
решением, и это гарантирует целостность решения. Узлы в распределенной
системе имеют доступ только к их собственному состоянию и не к глобальному
состоянию всей системы. Следовательно, не возможно делать решение
управления основанным на глобальном состоянии. Это имеет место тот факт, что узел может получать информацию относительно состояния других узлов и
базировать решения управления на этой информации. В отличие от
централизованных систем, факт, что полученная информация является старой, может стать причиной получения недопустимой информации, потому что
состояние другого узла, возможно, изменилось между посылкой информации
состояния и решения, основанного на этом. Состояние подсистемы связи (то
есть, какие сообщения находятся в транзите в некоторый момент) никогда
непосредственно не наблюдается узлами. Эта информация может только быть
выведена косвенно, сравнивая информацию относительно сообщений, посланных
и полученных узлами. Недостаток глобального кадра времени. События, составляющие выполнение централизованного алгоритма полностью
упорядочиваются естественным способом их временным появлением; для каждой
пары событий, каждое происходит ранее или позже чем другое. Временное
отношение, вызванное на событиях, составляющих выполнение распределенного
алгоритма - не общее количество; Для некоторых пар событий может иметься
причина для решения, что каждое происходит перед другим, но для других пар
имеет место, что ни одно из событий не происходит перед другим [Lam78].
Взаимное исключение может быть достигнуто в централизованной системе
требующих его, если доступ процесса p к ресурсу начинается позже чем доступ
процесса q, то доступ процесса p начался после того, как доступ процесса q
закончился. Действительно, все такие события (старт и окончание доступа
процессов p и q) полностью упорядочиваются отношением временного
предшествования; в распределенной системе они - не упорядочиваются, и та же
самая стратегия не достаточна. Процессы p и q могут начать обращаться к
ресурсу, в то время как начало одного не предшествует началу другой.
(3) Недетерменизм. Централизованная программа может описывать
вычисления, поскольку они разворачиваются из некоторого ввода
недвусмысленно; имея данную программу и ввод, только одиночное вычисление
возможно. Напротив, выполнение распределенной системы обычно не
-детерминировано, из-за возможных различий в быстродействии выполнения
компонентов системы.
Рассмотрим ситуацию, где процесс сервера может получать запросы из неизвестного числа процессов пользователя. Сервер не может приостановить обработку запросов, пока все запросы не были получены, потому что не известно, сколько сообщений прибудет. Следовательно, каждый запрос должен быть обработан немедленно, и порядок обработки - порядок, в который запросы прибывают. Порядок, в котором клиентура посылает их запросы, может быть известен, но поскольку задержки передачи не известны, запросы могут прибывать в различном порядке.
Комбинация недостатка знания относительно глобального состояния, недостаток глобального кадра времени, и недетерменизм делает проект
распределенных алгоритмов запутанным ремеслом, потому что три аспекта
вмешиваются несколькими способами. Понятия времени и состояния очень
связаны; в централизованных системах понятие времени может быть определено, рассматривая последовательность состояний, принятых системой в течение
выполнения. Даже при том, что в распределенной системе глобальное состояние
может быть определено, и выполнение может рассматриваться как
последовательность глобальных состояний (Определение 2.2), это
представление имеет ограниченное использование, так как выполнение может
также быть описано другими последовательностями глобальных состояний
(Теорема 2.21). Те альтернативные последовательности обычно состоят из
различных глобальных состояний; это придает утверждению "система, принимала
это или то состояние в течение выполнения " очень сомнительное значение.
Недостаток знания относительно глобального состояния мог бы
компенсироваться, если было возможно предсказать это глобальное состояние
из алгоритма, который выполняется. К сожалению, это не возможно из-за
свойственного недетерменизма в выполнении распределенных систем.
[pic]
Рис. 1.5 Упрощенная сетевая архитектура
1.3.2 Пример: Связь с одиночным сообщением
Мы проиллюстрируем трудности, налагаемые недостатком знания
относительно глобального состояния и недостатка глобального кадра, с
помощью примера, обсужденного Beisnes [Bel76l, а именно надежный обмен
информацией через ненадежную среду. Рассмотрим два процесса a и b, связанных сетью передачи данных, которая передает сообщения от одного
процесса до другого. Сообщение может быть получено в произвольно длительное
время после того, как оно послано, оно может также быть потеряно в целом в
сети. Надежность связи увеличивается при использовании сетевых процедур
управления (NCPs), через который a и b обращаются к сети. Процесс a
инициализирует связь, передавая информационный модуль m к NCP A.
Взаимодействие между NCPs (через сеть передачи данных, DN) должно
гарантировать, что информация m передана в процесс b (NCP B), после
которого a уведомляется относительно доставки (через NCP A). Структура
связи изображена в Рисунке 1.5. Даже если только одиночный информационный
модуль должен транспортироваться от a до b, ненадежность сети вынуждает NCP
A и NCP B вовлекаться в сеанс связи, состоящий из нескольких сообщений. Они
поддерживают информацию состояния относительно этого сеанса связи, но
потому что число возможных партнеров сеанса связи для каждого процесса
большое, то требуется, чтобы информация состояния была отброшена после
того, как обмен сообщениями завершен. Инициализация информации состояния
называется открытие, и ее отбрасывание называется закрытием сеанса связи.
Заметьте, что после закрытия сеанса связи, NGP находится в точно том же
самом состоянии как и перед открытием его; это называется закрытым
состоянием. Информационный модуль m., говорят, потерян, если a получил
уведомление от b, но модуль фактически не был никогда передан к b. Модуль
m, говорят, дублирован если он был передан дважды. Надежные механизмы
связи предотвращают и потери и дублирования. Принимается, что NCPs могут
терпеть неудачу, после которой они перезапускаются в закрытом состоянии
(действительно теряя всю информацию относительно открытого в настоящее
время сеанса связи).
Никакая надежная связь не достижима. Как первое наблюдение, может быть
показано, что независимо от того, как запутанно NCPs разработаны, не
возможно достигнуть полностью надежной связи. Это наблюдение может быть
сделано независимо от проекта сети передачи данных или NCPs и только
полагается на предположение, что NCP может терять информацию относительно
активного сеанса связи. Чтобы видеть это, предположим, что после того, как
инициализация связи a, NCP и NCP В запускает разговор(сеанс связи), в
течение которого NCP В доставляет м. b после получения сообщения М. из NCP
A. Рассмотрите случай где NCP В сбоями и перезапущен в закрытом состоянии
после того, как NCP послал сообщение, м. В этой ситуации, ни NCP ни NCP В
не может сообщать, был ли м. уже поставлен, когда NCP В потерпел крах; NCP, потому что это не может наблюдать события в NCP В (недостаток знания
относительно глобального состояния) и NCP В, потому что это потерпело крах
и было перезапущено в закрытом состоянии. Независимо от того, как NCPs
продолжают их разговор(сеанс связи), ошибку можно представлять. Если NCP
посылает сообщение NCP В, снова и NCP В доставляет сообщение, дублирование
может возникать. Если сообщение к дано без поставки, потеря может
возникать. Мы теперь оценим несколько возможных проектов NCPs относительно
возможности потери или дублирования сообщений. Мы пробуем разрабатывать
протоколы таким способом, которым потерь избегают в любом случае.
Cеанс связи с одним сообщением. В самом простом возможном проекте, NCP
А посылает данные, неизменные через сеть, сообщает об этом a, и
закрывается, в одиночном действии после инициализации. NCP В всегда
доставляет сообщение, которое он получает, к b и закрывается после каждой
доставки. Этот протокол представляет потерю всякий раз, когда сеть
отказывается доставлять сообщение, но не имеется никакой возможности
введения дублирований.
Cеанс связи с двумя сообщениями. Ограниченная защита против потери сообщений предлагается добавлением подтверждений к протоколу. В нормальном сеансе связи, NCP А посылает сообщение данных (данные, m) и ждет получения сообщения подтверждения (ack) из NCP B. Когда это сообщение получено, NCP А закрывает сеанс связи. NCP B, после получения сообщения (данные, m), доставляет m к b, отвечает сообщением (ack), и закрывается. Подводя итоги, можно сказать, что свободный от ошибок сеанс связи состоит из трех событий.
1. NCP А send (данные, m)
Рекомендуем скачать другие рефераты по теме: педагогические рефераты, реферат машини.
Предыдущая страница реферата | 4 5 6 7 8 9 10 11 12 13 14 | Следующая страница реферата