Разработка отказоустойчивой операционной системы реального времени для вычислительных систем с максимальным рангом отказоустойчивости
Категория реферата: Рефераты по информатике, программированию
Теги реферата: курсовые работы бесплатно, украинские рефераты
Добавил(а) на сайт: Silin.
Предыдущая страница реферата | 11 12 13 14 15 16 17 18 19 20 21 | Следующая страница реферата
После обмена результатами голосования, в узлах может оказаться информация, представленная таблицей 2.22.
Таблица 2.22
|ПЭ№ |Данные |Возможная причина|Вывод |Консолидирован|
| |голосова|неисправности | |ное решение |
| |ния от |ПЭ № или Линк| | |
| |ПЭ № |№ | | |
| |1 |Нет неисправности| | |
|1 |2 |5 |Неисправен | |
| | |2-5 |2-5 | |
| |5 |2 | | |
| | |2-5 | | |
| |1 |Нет неисправности| | |
|2 |2 |5 |Неисправен |Неисправен |
| | |2-5 |2-5 |2-5 |
| |5 |"мусор" | | |
| |1 |Нет неисправности| | |
|5 |2 |"мусор" |Неисправен | |
| | | |2-5 | |
| |5 |2 | | |
| | |2-5 | | |
Анализ ПЭ1 предварительной информации подтверждает отказ линка 2-5, так как
исправность ПЭ2 и ПЭ5 подтверждается информацией от ПЭ1.
Анализ ПЭ2 и ПЭ3 поступившей информации говорит о неисправности линка 2-5, в силу того, что ПЭ1 подтверждает правильность результатов ПЭ2 и ПЭ5.
Рассмотрим дальнейшее функционирование системы (рис. 2.9).
[pic]
Отказ ПЭ5 и ПЭ2 диагностируется также, как было показано выше, так как не нарушается связность между двумя ПЭ. Отказ связи 1-5 воспринимается ПЭ1 и ПЭ2, как отказ ПЭ5. Аналогично, отказ связи 1-2 равносилен отказу ПЭ2.
В процессе функционирования в системе всегда существует старший ПЭ, который выдает объекту управления согласованные данные. Если после принятия консолидированного решения, обнаруживается сбой в старшем элементе, то старшим назначается другой ПЭ, имеющий максимальное количество связей или младший номер, если количество связей у всех ПЭ одинаково. В предыдущум примере (при изоляции ПЭ3) этот прием позволяет прекратить выдачу данных с изолированного ПЭ.
В данном варианте может возникнуть ситуация, когда ПЭ2 при отказе
линка 1-2 принимает решение об отказе ПЭ1 и становится старшим элементом, как ПЭ с младшим номером. При этом он принимает решение об отключении ПЭ5.
Одновременно ПЭ1 и ПЭ5 принимают решение об отказе ПЭ2 и в свою очередь
исключают его из текущей конфигурации. Тогда наступает ситуация, когда
одновременно на выход подаются два, возможно и разных варианта. Чтобы
избежать такой ситуации, необходимы спецальные аппаратные или программно-
аппаратные средства, которые в рамках данной работы не рассматриваются.
Если сделать предположение о равновероятности отказов в системе, изображенной на рис.2.9, то вероятность отказа линка 2-1, приводящая к неопределенности в системе, равна 0.2. Однако в реальных ВС вероятность отказа канала связи считается величиной на порядок меньшей, чем вероятность отказа ПЭ за этот же период времени.
Отказ канала 1-5 не приведет к неопределенности. ПЭ5 не станет старшим в любом случае и будет отключен. Отказ ПЭ1 также не приведет к неопределенности, управление возьмет на себя ПЭ2.
На предпоследнем этапе деградации системы в системе остается 2 исправных ПЭ, соединенных одним каналом связи. При на первый план в качестве диагностической информации выходят признаки исправности/неисправности, формируемые различными программно- аппаратными средствами контроля, такими как функциональный контроль вычислений с помощью специальных контрольных операторов, контроль входной информации по специальным признакам и контрольным суммам, контроль выходной информации по квитанции от приемника и тд.
Следует отметить, что «жесткое» использование признаков неисправности, вырабатываемых контрольными тестами аппаратуры, может привести к появлению ошибок второго рода («ложная тревога») и исключению из вычислительного процесса функционально-пригодной аппаратуры. Это приводит к необходимое применения гибких моделей совместного использования результатов голосования и признаков контрольных средств.
2.5.2. Методика анализа отказов
Исходя из этого примера, помимо модуля голосования систему необходимо дополнить гибким механизмом анализа отказов.
Подсистема анализа отказов должна инициироваться модулем коммуникации, по завершению обмена результатами голосования, и оперировать следующей
информацией:
. Результатами голосования (предварительными выводами по результатам сравнения) функциональной информации;
. Сигналами модуля коммуникации о неверной контрольной сумме пакета, о тайм- ауте при приеме пакета, об отсутствии или неверном коде квитанции.
Логика выводов при анализе данных голосования и информации от модуля
коммуникации такова:
. Несовпадение данных при элементарной проверке результатов счета на очередном цикле диагностируется, как отказ ПЭ или канала связи этого ПЭ, при этом голосование проводится каждым ПЭ (с номером m) по результатам от
ПЭ с номерами (m-1) mod N и (m-2) mod N.
. При несовпадении данных при элементарной проверке результатов счета, полученных с использованием транзитной передачи, под сомнение ставится вся цепочка, задействованная при передаче.
. При несовпадении ни одного результата счета под сомнение ставится все участвовавшие в обмене ПЭ и связи.
. Несовпадение контрольной суммы или тайм-аут при приеме данных трактуется как сбой ПЭ или канала связи ПЭ.
. Отсутствие квитанции трактуется как сбой ПЭ или канала связи ПЭ.
. Неверный код квитанции трактуется как сбой канала связи ПЭ.
Для принятия решения об отказе (сбое) того или иного элемента ВС (ПЭ, канала связи) по набору выводов от каждого узла сети, был предложен следующий эвристический алгоритм, при выполнении условия об ординарности потока отказов:
1. Создается матрица состояния ВС, которая размерностью идентична модифицированной матрице связности ПЭ, но по главной диагонали находятся данные о ПЭ, а в ячейках матрицы – о каналах связи.
2. Матрица состояния ВС инициализируется единицами.
3. После обмена предварительными результатами голосования, у каждого
ПЭ оказывается результаты голосования от всех ПЭ ВС и диагностическая информация от модуля коммуникации.
4. Последовательно, в соответствии с логикой, изложенной выше, делается вывод по каждой записи, и очередное предположение заносится в матрицу состояния ВС путем вычитания единицы из ячейки, соответствующей элементу ВС, не в пользу которого делается это предположение.
5. Если выводом по очередной записи становится отсутствие отказов по определенным элементам, то это предположение заносится в матрицу состояния ВС путем инкрементирования ячейки, соответствующей элементу ВС, в пользу которого делается это предположение.
6. После обработки всех записей, матрица состояний ВС просматривается на предмет поиска минимального отрицательного значения.
Рекомендуем скачать другие рефераты по теме: российская федерация реферат, изложение.
Предыдущая страница реферата | 11 12 13 14 15 16 17 18 19 20 21 | Следующая страница реферата