VMware/vSphere

VMware vSphere High Availability (HA) Deep Dive#03

JuneJoon 2020. 2. 2. 20:44

02번 포스트에서 언급했던 그림을 다시 한번 보고 넘어가면 좋을 것 같네요. 

 

Slave ?  Master !? 

이전 포스트를 하면서 정리한 내용 중 하나인 FDM Agent에 대해 알아보려고 합니다. HA를  vCenter Server에서 구성하게 되면, HA 도메인(일반적으론 클러스터라고도 하죠)에 속해있는 각각의 vSphere 서버로 FDM 에이전트가 설치되게 되는데요, 설치 후 정상적으로 FDM 에이전트끼리 연동이 완료가 된다면 에이전트끼리 선거를 시작하며,  그림에서와 같이 Master - Slave의 역할로 나뉘게 됩니다. 

 

vCenter Server의 상태화면에서도 쉽게 확인이 가능하다

 

네트워크의 장애로 인하여 Network Partitioning이 발생하지 않는 이상. 하나의 HA Domain의 마스터는 1명이 맡게 되며 그 외의 에이전트는 모두 슬레이브가 됩니다. 마스터 에이전트는 대상 도메인의 VM에 대한 Monitoring을 담당하게 되며, 문제가 발생했다고 판단하게 되면 대상 VM에 대한 재시작 권한을 가지고 있습니다. 슬레이브 에이전트들은 자신의 하이퍼저에서 구동 중인 VM에 대한 정보를 마스터에게 전달하게 되며, 자신의 하이퍼바이저에서의 Action(마스터에서 지시한 VM 재시작 등..)을 수행하는 역할을 합니다. 

 

- Election (선거)

앞서 언급했던 내용과 같이, HA 에이전트(FDM Anget)는 연동 후 선거를 통해 마스터 / 슬레이브 관계를 가져가게 되는데요, 선거는 제비뽑기... 는 아니고 다음과 같은 우선순위를 가진 Host가 마스터로 선출됩니다.

 

* 연결된 Datastore가 많은 호스트 

* (동률일 경우) HOST MOD가 높은 호스트 

 

MOD의 경우 vCenter에서 구분하는 Instance UUID이며, 별도의 설정이 없다면 임의적으로 부여됩니다. 대상 ID 확인에 대하여 하단 블로그에 설명이 잘 되어있어 링크를 같이 첨부드립니다.

(https://www.danilochiavari.com/2014/03/28/how-to-quickly-match-a-moref-id-to-a-name-in-vmware-vsphere/)

 

다음과 같은 조건의 경우 HA Cluster는 Re Election에 들어갑니다. 

 

- Host Down 

- Network Partitioning / isolated 

- Disconnected from vCenter Server 

- Put into Maintenect mode ( at master) 

- when HA is reconfigured on the host 

 

다음에는 Re Election과 HA를 동작하기위한 Heart Beat(HB) 메카니즘에 대해서 포스팅 하겠습니다.

 

감사합니다.

반응형