Дизайн мультисайтового SCOM

Ответить
iHumster
Завсегдатай
Сообщения: 45
Зарегистрирован: 08 окт 2013 05:24
Откуда: Тюмень, Россия
Контактная информация:

Дизайн мультисайтового SCOM

Сообщение iHumster »

Прошу помощи у более опытных камрадов.

Планирую развертывание инфраструктуры SCOM 2012 и вот задумался над мультисайтовой конфигурацией.

Опишу структуру нашей сети. Есть центральный офис в городе, в котором находится ЦОД, там установлена основная масса оборудования и находятся основные сервисы компании. Так же есть несколько филиалов в этом же городе и в других городах области соединенных в единую сеть посредством VPN. В каждом филиале есть некоторое количество сетевых устройств (Cisco Routers and Switches) и серверов (серверы Hyper-V). VPN между филиалами иногда рвется ввиду несовершенности каналов связи.

Хотелось бы собирать с филиалов в основную группу управления, которая будет расположена в центральном ЦОДе, информацию по конфигурации и производительности сетевых устройств, информацию о работоспособности виртуальной инфраструктуры с помощью SCOM.

Какие варианты развертывания SCOM подойдут для подобной конфигурации?
Аватара пользователя
Алексей Максимов
Администратор сайта
Сообщения: 572
Зарегистрирован: 14 сен 2012 06:50
Откуда: г.Сыктывкар
Контактная информация:

Re: Дизайн мультисайтового SCOM

Сообщение Алексей Максимов »

Сколько объектов мониторинга (серверов, сетевых устройств) расположено в центральном офисе и сколько на подразделениях? Ширина каналов от центрального офиса до подразделений? Есть-ли требование к повышению доступности SCOM, как инфраструктурного сервиса?
iHumster
Завсегдатай
Сообщения: 45
Зарегистрирован: 08 окт 2013 05:24
Откуда: Тюмень, Россия
Контактная информация:

Re: Дизайн мультисайтового SCOM

Сообщение iHumster »

Сколько объектов мониторинга (серверов, сетевых устройств) расположено в центральном офисе и сколько на подразделениях?
В ЦОДе порядка 20 сетевых устройств, около 100 серверов (native и виртуальных).
В филиалах около 3-5 сетевых устройств и 10-15 серверов.
Ширина каналов от центрального офиса до подразделений?
Ширина каналов разная, варьируется от 2 до 10 Мб/с
Есть-ли требование к повышению доступности SCOM, как инфраструктурного сервиса?
В ЦОДе - да. В филиалах - нет.
Аватара пользователя
Алексей Максимов
Администратор сайта
Сообщения: 572
Зарегистрирован: 14 сен 2012 06:50
Откуда: г.Сыктывкар
Контактная информация:

Re: Дизайн мультисайтового SCOM

Сообщение Алексей Максимов »

С учетом требований к повышению доступности SCOM, думаю, оптимально будет развернуть два Management-сервера SCOM (в категориях SCOM 2012 это будет считаться пулом), которые будут использовать общую БД, расположенную на отдельном экземпляре SQL Server (в идеале кластеризованном). На сервера и сетевые устройства из структурных подразделений - просто развернуть агентов SCOM.
iHumster
Завсегдатай
Сообщения: 45
Зарегистрирован: 08 окт 2013 05:24
Откуда: Тюмень, Россия
Контактная информация:

Re: Дизайн мультисайтового SCOM

Сообщение iHumster »

Алексей Максимов писал(а):На сервера и сетевые устройства из структурных подразделений - просто развернуть агентов SCOM.
Во время обрывов VPN хотелось бы продолжить сбор статистики Performance, Events и т.п.
Как быть в таком случае?
Аватара пользователя
Алексей Максимов
Администратор сайта
Сообщения: 572
Зарегистрирован: 14 сен 2012 06:50
Откуда: г.Сыктывкар
Контактная информация:

Re: Дизайн мультисайтового SCOM

Сообщение Алексей Максимов »

Ставить дополнительный сервер на каждом структурном подразделении для обслуживания 10-15 агентов смысла особого нет. Это только усложнит Вам жизнь. Если каналы совсем "грустные" и разрывы соединения происходят очень часто и на немаленькие интервалы времени, то можно попробовать выполнить дополнительную настройку кэша агентов SCOM, находящихся на этих подразделениях. По умолчанию агент SCOM настроен таким образом, что способен собирать очередь событий для отправки на сервер управления в размере не более 15 Mb.
Эти данные агент хранит в подкаталоге Health Service Store (для SCOM 2012 путь по умолчанию C:\Program Files\System Center Operations Manager\Agent\Health Service State\Health Service Store)
Если у агента будет потеряна связь с сервером, то он накопит этот кэш и далее просто начнёт перезатирать в нём более старые события. Увеличить этот предел можно через параметр реестра (в килобайтах):

HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\services\HealthService\Parameters\Management Groups\<Имя группы управления>\maximumQueueSizeKb
iHumster
Завсегдатай
Сообщения: 45
Зарегистрирован: 08 окт 2013 05:24
Откуда: Тюмень, Россия
Контактная информация:

Re: Дизайн мультисайтового SCOM

Сообщение iHumster »

То есть агенты SCOM в филиалах будут работать в качестве proxy (после включения данной возможности в свойствах агентов) и смогут копить информацию об ивентах и перфомансе мониторящихся там сетевых устройств? Я правильно понимаю? А увеличив им кэш мы сможем таким образом подстраховаться от разрывов соединения.

Тогда еще вопрос, после восстановления соединения между филиалом и ЦОДом эти 15-20 клиентов начнут передавать данные в кэше на сервер и могут не некоторый промежуток времени забить весь канал связи. Можно ли как-то ограничить скорость передачи для агентов? Есть такой параметр в реестре?
Аватара пользователя
Алексей Максимов
Администратор сайта
Сообщения: 572
Зарегистрирован: 14 сен 2012 06:50
Откуда: г.Сыктывкар
Контактная информация:

Re: Дизайн мультисайтового SCOM

Сообщение Алексей Максимов »

iHumster писал(а):То есть агенты SCOM в филиалах будут работать в качестве proxy (после включения данной возможности в свойствах агентов) и смогут копить информацию об ивентах и перфомансе мониторящихся там сетевых устройств? Я правильно понимаю?
Не совсем. Включение опции проксирования в свойствах агента на SCOM не имеет отношения к мониторингу отдельно взятых сетевых устройств. Проксирование на управляемом агенте (система с установленным программным агентом SCOM) это функция которая позволяет через этого агента передавать данные о состоянии сущностей, частью которых являются эти сервера. Например у вас есть два сервера с Windows Server 2012, оба они включены в кластер Windows Failover Cluster. Чтобы мониторить эти сервера как отдельные сущности (Компьютер Windows) не требуется включение опции проксирования, а вот чтобы можно было мониторить состояние кластера - для обоих серверов в консоли SCOM потребуется включить проксирование. Надеюсь общий смысл термина проксирования в контекcте агентов SCOM понятен.
При отсутствии связи с сервером SCOM, установленный агент SCOM будет использовать кэш. А вот сетевые устройства, как вы понимаете, такой возможности не имеют, и в подавляющем большинстве их мониторинг представляет собой периодический опрос непосредственно с серверов управления, и соответсвенно, нет связи между сетевым устройством и серверов SCOM = нет данных мониторинга. Тут, как говорится, чудес не бывает. Хотя на самом деле, многое зависит от самого сетевого оборудования и вашей фантазии. Например, если сетевое оборудование поддерживает функции сброса своих логов на отдельные выделенные системы (расположенные на той-же площадке), то можно взамен стандартному мониторингу сетевых устройств (ну или в дополнение) опрашивать со SCOM эти логи с этих выделенных систем.
iHumster писал(а):Тогда еще вопрос, после восстановления соединения между филиалом и ЦОДом эти 15-20 клиентов начнут передавать данные в кэше на сервер и могут не некоторый промежуток времени забить весь канал связи. Можно ли как-то ограничить скорость передачи для агентов? Есть такой параметр в реестре?
Мне не известно встроенных механизмов управления полосой пропускания в SCOM, поэтому как приемлемый вариант видится использование приоритезации трафика (QoS) на стороне маршрутизирующего сетевого оборудования.
Ответить

Вернуться в «System Center Operations Manager»