Вестник итарк




НазваниеВестник итарк
страница9/13
Дата публикации16.06.2013
Размер1.4 Mb.
ТипДокументы
lit-yaz.ru > Информатика > Документы
1   ...   5   6   7   8   9   10   11   12   13
^

Моделирование процессов, систем и технологий



УДК 681.3

НАДЕЖНОСТЬ ДУБЛИРОВАННОГО КОММУТАТОРА


В.А. Богатырев, С.В. Богатырев, А.В. Богатырев 9
Аннотация: Предложена оценка надежности компьютерной системы с дублированием коммутаторов при выделении двух функциональных групп компьютерных узлов и требовании обеспечения связанности между любым из компьютерных узлов первой группы и любым узлом второй группы. В коммутаторах выделяется базовое оборудование, отказ которого приводит к полному отказу коммутатора, и оборудование, отнесенное к портам, отказ которого, приводит к частичной потере коммутационных возможностей коммутатора.

Ключевые слова: надежность, коммутатор, дублирование, отказоустойчивость.
Введение

К системам компьютерного управления, особенно технологическими процессами и транспортными системами, предъявляются жесткие требования по надежности, отказоустойчивости и производительности. В связи с постоянным опережением роста сложности систем управления по сравнению с ростом надежности используемых средств вычислительной техники, представляются актуальными исследования методов и технических решений по обеспечению и оценке отказоустойчивости компьютерных систем.

Современные коммуникационные подсистемы, как правило, строятся на основе коммутаторов, при этом в системах управления коммуникационная подсистема должна выдерживать, по крайней мере, однократные отказы, то есть коммуникационные средства, как минимум, должны дублироваться.

Функционирование избыточной (резервированной) коммуникационной подсистемы возможно либо в режиме переключения резерва, когда резервные коммутаторы подключаются только после отказов основных коммутаторов, либо в режиме распределения нагрузки, когда связь может осуществляться через все резервные коммутаторы [1]. В первом режиме повышается только надежность, а во втором еще и производительность системы. В режиме распределения нагрузки коммутаторы, частично потерявшие в результате отказов свои коммуникационные возможности, могут не отключаться, а использоваться в режиме деградации с потерей производительности по мере накопления отказов.

Сложность анализа исследуемых систем с резервированием коммутаторов обусловлена следующими причинами:

- модель надежности исследуемых систем с учетом отказов средств связи компьютеров и коммутаторов в общем случае, не сводится к параллельно-последовательной схеме соединения элементов надежности;

- возможно множество пересекающихся минимальных сечений, что приводит к сложному комбинаторному влиянию расположения отказов коммуникационных средств (сетевых адаптеров (СА) портов коммутаторов линий связи) на надежность системы;

- пересекаемостью оборудования коммутатора, задействованного при связи различных пар компьютеров, что приводит к необходимости выделения в каждом из резервированных коммутаторов оборудования, отказ которого приводит к полному отказу коммутатора, и оборудования, приводящего к потере только части его коммуникационных возможностей (деградация);

- потенциальной возможностью повышения эффективности системы в результате использования для распределения трафика частично работоспособных состояний резервированных коммутаторов (с частичной потерей коммуникационных возможностей);

- возможной неполнодоступностью коммутаторов для компьютерных узлов, образуемой в результате отказов (деградации) коммуникационных средств (сетевых адаптеров, портов коммутаторов, их базового оборудования и линий связи) или закладываемой при проектировании из-за конструктивных ограничений на число встраиваемых в компьютеры сетевых адаптеров и ограниченного числа портов коммутаторов.

Рассматриваемая постановка задачи анализа коммуникационной подсистемы, по сравнению с традиционной, при которой каждый коммутатор рассматривается в двух состояниях (исправен/отказал), позволяет провести более тонкое исследование надежности рассматриваемых систем и, в конечном результате, добиться их более эффективного построения.

Рассмотрим компьютерные системы, в которых выделяются два уровня компьютерных узлов (например, серверы и клиентские рабочие станции или серверы и системы хранения или компьютеры и контроллеры сбора информации и т.д.) и резервированная коммуникационная подсистема. Коммуникационная подсистема обеспечивает взаимосвязь любого узла верхнего уровня со всеми узлами нижнего уровня. Связь между узлами внутри одного уровня не обязательна. Число компьютерных узлов верхнего уровня m1, а нижнего m2.

Анализ надежности систем с резервированием коммутаторов на основе комбинаторно-вероятностного метода проведен в работе [2], в которой удалось получить приближенную оценку надежности с учетом условий формирования минимальных сечений в зависимости от комбинаторного распределения отказавших средств соединения компьютерных узлов и коммутаторов (сетевых адаптеров-линий связи – портов коммутаторов). В работе [3] при нижней оценке надежности предполагается, что в работоспособной системе, содержащей в исходном состоянии m1 узлами первой и m2 второй группы, должно быть, по крайней мере, a3 исправных коммутаторов, обеспечивающих связь через сетевые адаптеры с a1 исправными узлами первой группы и a2 исправными узлами второй группы. Пессимизм оценки обусловлен тем, что система может быть работоспособна, когда связь между a1 исправными узлами первой группы и a2 исправными узлами второй группы обеспечивается всей совокупностью коммутаторов, а не каждым из них в отдельности. При верхней оценке в работе [3] считается, что каждый исправный компьютерный узел первой и второй группы через исправные СА должен быть подключен хотя бы к одному из исправных коммутаторов. Оптимистичность оценки обусловлена тем, что как исправные могут быть идентифицированы состояния, при которых работоспособные узлы первой группы подключены к одним, а второй группы – к другим исправным коммутаторам, что приводит к несвязанности узлов разных групп.

Таким образом, в работах [2, 3] предложены методы оценки надежности коммуникационной подсистемы, связывающей две группы компьютерных узлов при обмене между узлами разных групп, однако эти методы являются приближенными и характеризуются вычислительной сложностью.

В связи с тем, что на практике построения отказоустойчивых систем в настоящее время, как правило, ограничиваются дублированием коммуникационных средств, актуальным представляется разработка точных методов оценки надежности таких систем.

^ Постановка задачи

Рассматривается коммуникационная подсистема, реализованная на дублированных коммутаторах с выделением в системе двух функциональных групп компьютерных узлов (двухуровневая система). Число компьютерных узлов верхнего уровня m1, а нижнего m2, (). Структурная схема исследуемой компьютерной системы (сети) с дублированием коммутаторов представлена на рис. 1.



Рис. 1. Компьютерная система с дублированием коммутаторов.
Подключение каждого из m компьютеров к коммутатору осуществляется через цепь “сетевой адаптер - линия - порт коммутатора” – СА-Л-ПК.

Коммуникационная подсистема считается исправной, если она обеспечивает связь между любой парой компьютерных узлов, один из которых относится к первой (к верхнему уровню), а второй ко второй группе (к нижнему уровню).

Будем считать известными данные по надежности компьютерных узлов, СА, коммутаторов и линий связи. Распределение времени между отказами будем считать экспоненциальным, а отказы компонентов системы – независимыми. Требуется оценить надежность коммуникационной подсистемы.
^ Условие работоспособности и отказа коммуникационной подсистемы

При оценке надежности коммуникационной подсистемы необходимо учитывать исправность базового оборудования коммутаторов и целостность цепей “сетевой адаптер - линия - порт коммутатора” (СА-Л-ПК).

Состояние коммуникационной подсистемы отображается матрицей nxm, элемент которой sij = 1, если j-й компьютерный узел способен к взаимодействию с i-м коммутатором (СА, подключающий j-ый компьютерный узел через исправную линию к i-му исправному коммутатору, исправен), в противном случае – sij = 0 [4, 5].

В работе [4, 5] сформулированы условия отказа коммуникационной подсистемы с резервированием средств связи между компьютерными узлами, при необходимости связанности между любой парой компьютерных узлов (без их разделения на функциональные группы).

Утверждение 1. При отказе коммуникационной подсистемы в матрице nxm можно выделить подматрицу , в каждой строке которой находится хотя бы один нулевой элемент.

Для двухуровневых систем с дублированием коммутаторов состояние коммутационной подсистемы отображается матрицей 2xm, , причем подматрица S1 из m1 первых столбцов отображает подключение к дублированным коммутаторам компьютерных узлов первой группы (верхнего уровня), а подматрица S2 из m2 остальных столбцов отображает подключение к коммутаторам компьютерных узлов второй группы (нижнего уровня).

Для двухуровневых систем с дублированием коммутаторов верно следующее обобщения сформулированных выше условий отказа (образования сечений).

Утверждение 2. При отказе двухуровневых систем с дублированием коммутаторов в матрице 2xm можно выделить один столбец со всеми нулевыми элементами, или подматрицу , один столбец которой принадлежит подматрице S1, а второй – S2, причем в каждой строке выделенной подматрицы имеется хотя бы один нулевой элемент.

Например, при m1 = 2 и m2 = 3 состоянию отказа коммуникационной подсистемы соответствуют матрицы (с учетом всевозможных перестановок строк и столбцов в подматрицах S1 и S2, разделенных в матрице пунктиром):

, , , .

Из сформулированных условий отказа (образования сечений) следуют нижеприведенные условия работоспособности коммуникационной подсистемы двухуровневой компьютерной системы с дублированием коммутаторов.

Следствие 1. Если в матрице имеется один нулевой элемент, расположенный в i-й строке (i = 1,2), подматрицы S1 (либо S2), то при работоспособности системы все элементы другой строки подматрицы S2 (S1) должны быть единичными.

Следствие 2. Если в матрице все элементы подматрицы S1 (либо S2) находятся в единичном состоянии, то при работоспособности системы в каждом столбце подматрицы S2 (S1) должен содержаться хотя бы один единичный элемент.

Следствие 3. Если в матрице все элементы хотя бы одной строки находятся в единичном состоянии, то соответствующее состояние коммуникационной подсистемы – работоспособно.

Таким образом, работоспособные состояния системы отображаются матрицами вида:

, (1)

, (2)

(3)

где , а столбец принимает одно из значений , , .
Оценка надежности коммуникационной подсистемы

При построении модели надежности коммуникационной подсистемы в каждом коммутаторе выделяется некоторое базовое оборудование (вероятность его работоспособности р0), отказ которого приводит к полному отказу коммутатора, и оборудование, отнесенное к портам. Отказ оборудования, отнесенного к каждому порту, приводит к потере связанности коммутатора только с одним компьютерным узлом, причем эта связанность теряется при отказе любого элемента цепи “СА-Л-ПК”. Вероятность сохранения связанности компьютерного узла с коммутатором р = рa рl рs, где рa, рl, рs – вероятности исправности элементов цепи “СА-Л-ПК”.

С учетом сформулированных условий работоспособности дублированной коммуникационной подсистемы вероятность ее работоспособности определим как
,

где первое слагаемое соответствует вероятности работоспособности коммуникационной подсистемы при исправности базового оборудования двух коммутаторов, а второе одного из них, вероятность связанности которого со всеми компьютерными узлами равна .

При исправности базового оборудования двух коммутаторов вероятность работоспособного состояния коммутационной подсистемы, отображаемого матрицей вида (1), определяется как

, ,

Вероятности P2 и P3 работоспособных состояний коммуникационной подсистемы, отображаемых матрицами вида (2) и (3), исключая состояния, при которых в матрице имеется строка со всеми единичными элементами (учитываемые при подсчете работоспособных состояний вида (1)), вычислим как

, (4)

. (5)

При этом формулы (4), (5) подсчитывают всевозможные работоспособные состояния коммуникационной подсистем, представленные соответственно матрицами вида (6) и (7).

, (6)

. (7)

Зависимость вероятности работоспособности дублированной коммуникационной подсистемы двухуровневой компьютерной системы при изменении вероятности сохранения связанности компьютерного узла с коммутатором (исправности цепи СА-Л-ПК) представлена на рис. 2 кривыми 1-3 для вероятности исправности базового оборудования коммутатора р0 равного 0,94, 0,96 и 0,98 соответственно. На рис. 2 кривые 4-6 отражают вероятность сохранения работоспособности коммуникационной подсистемы без резервирования соответственно при значениях р0 равных 0,94, 0,96 и 0,98.



Рис. 2. Вероятность работоспособности коммуникационной подсистемы.
В предположении экспоненциального распределения времени между отказами вероятность сохранения работоспособности цепи “СА-Л-ПК” и базового оборудования коммутатора в течение времени t:

, ,

где 0,  – суммарные интенсивности отказов базового оборудования коммутатора и цепи “СА-Л-ПК”. При этом  = ca + pk +l, где ca, pk, l – интенсивности отказов компонентов цепи “СА-Л-ПК”.

Зависимость вероятности работоспособности дублированной коммуникационной подсистемы двухуровневой компьютерной системы от времени функционирования при 1/ч представлена на рис. 3 кривыми 1-3 соответственно для 1/ч.



Рис.3. Зависимость вероятности работоспособности дублированной

коммуникационной подсистемы от времени ее функционирования.
Таким образом, предложен метод оценки надежности коммуникационной подсистемы компьютерной системы с дублированием коммутаторов при выделении двух функциональных групп компьютерных узлов (двухуровневая организация системы) и требовании обеспечения связанности между любым из компьютерных узлов первой группы и любым узлом второй группы.

Определены условия работоспособности и отказа рассматриваемой коммуникационной подсистемы в зависимости от комбинаторного распределения отказов коммутаторов и средств их подключения к компьютерам.

При построении модели надежности в каждом коммутаторе выделяется некоторое базовое оборудование, отказ которого приводит к полному отказу коммутатора, и оборудование, отнесенное к портам, отказ которого, приводит к частичной потере коммутационных возможностей коммутатора.

Предложенные модели надежности могут быть применены для анализа многоуровневых (с выделением нескольких функциональных групп узлов) компьютерных систем и сетей, в том числе, локальных сетей с организацией “клиент-сервер”, сетей хранения данных, систем связи промышленных компьютеров с датчиками и исполнительными механизмами и д.п.

Библиографический список


  1. Олифер В.Г., Олифер Н.А. Компьютерные сети. Принципы, технологии, протоколы, –СПб: Питер. 2011. – 944 с.

  2. Богатырев В.А. Комбинаторно-вероятностная оценка надежности и отказоустойчивости кластерных систем // Приборы и системы. Управление, контроль, диагностика. 2006 №6. – С 21-26.

  3. Богатырев В.А. Отказоустойчивость и сохранение эффективности функционирования многомагистральных распределенных вычислительных систем. // Информационные технологии. 1999. № 9. – С. 44-48.

  4. Богатырев В.А. Комбинаторный метод оценки отказоустойчивости многомагистрального канала. // Методы менеджмента качества. 2000. № 4. – С. 30-35.

  5. Богатырев В.А. Оценка надежности резервированной коммуникационной подсистемы отказоустойчивой компьютерной системы // Приборы и системы. Управление, контроль, диагностика. 2008. № 6. – С. 12-16.

  6. Богатырев В.А. Надежность двухуровневой отказоустойчивой компьютерной системы при дублировании связей между узлами // Вестник компьютерных и информационных технологий. 2009. № 1. – С. 2-7.

  7. Богатырев В.А., Богатырев С.В. Надежность резервированной двухуровневой компьютерной системы при ограниченном времени обслуживания запросов // Информационные технологии. 2009. №. 7. – С. 25-32.



V.A.Bogatyrev, S.V.A.Bogatyrev, .A.V.Bogatyrev
^ RELIABILITY OF THE DUPLICATED SWITCHBOARD
Abstract: The estimation of reliability of computer system with duplication of switchboardsis offered at allocation of twogroups of computer knots and the requirement of maintenance of coherence between any of computer knots of the first group and any knot of the second group. In switchboards the base equipment which refusal leads to full refusal of the switchboard, and the equipment carried to ports, which refusal is allocatedleads to partial loss of switching possibilities of the switchboard.

Keywords: reliability, the switchboard, duplication, fault tolerance.
УДК 65.012.62
1   ...   5   6   7   8   9   10   11   12   13

Похожие:

Вестник итарк iconБюллетень экспериментальной биологии и медицины ▲ Вестник дерматологии...
Вестник Московского университета. Серия 15. Вычислительная математика и кибернетика ▲

Вестник итарк iconЮрген Граф Миф о холокосте Правда о судьбе евреев во второй мировой...
В издательство «Русский Вестник», с просьбой опубликовать этот материал, обратился Институт пересмотра истории (Institute Historical...

Вестник итарк iconВикторина Заключение: Меры по защите окружающей среды ход: Слово...
Сегодня мы с вами проводим практическую пресс-конференцию «Экологический вестник». На конференции мы рассмотрим более подробно экологическое...

Вестник итарк iconЗорина Л. Любовь, рожденная на войне // Беловский вестник. – 2000....
Зорина Л. Любовь, рожденная на войне // Беловский вестник. – 2000. – №58 (9969). 18 мая. – С. 2

Вестник итарк iconВестник 2012

Вестник итарк iconЗарубежной историографии
Статья опубликована в журнале Вестник гуманитарного института тгу. – 2010. №2 (6)

Вестник итарк iconОпубликовано в: Вестник Ленинградского государственного университета...
...

Вестник итарк iconМои стихи: «Осень»
Стихотворение, посвященное славному юбилею – 75-летию газеты «Городищенский вестник»

Вестник итарк iconЧауниной Натальи Владимировны
Педагогический вестник. Вып сб науч тр. – Нерюнгри : Изд-во ягу, 1998. – С. 44–46

Вестник итарк iconМузейный вестник
Челябинско-Петраковской добровольческой, орденов Кутузова, Суворова Краснознаменной танковой бригады



Образовательный материал



При копировании материала укажите ссылку © 2013
контакты
lit-yaz.ru
главная страница