2011年7月7日 星期四

啟用vmware cluster的HA要注意的部份

vSphere4的HA要啟用, 除了大部分會注意到的之外, 還有很多很多因素都有可能導致啟用失敗, 或啟用成功但某台ESX重開機後又再度跟你抱怨HA啟動失敗, 因此稍微列一下要檢查的事項, 大致照明顯到比較難注意到的部份依序列出.



  1. ESX 都要在同一個cluster中.(廢話)
  2. ESX 的版本最好都一樣, 最多允許build號碼不同, 差到次版本號就會很難成功.
  3. management interface需要能互相連得到, 最好是同一個網段以減少問題.
  4. ESX的hostname都要設正確, 也就是必須符合ESX的management interface IP的反解與正解.
    • 若DNS並非您管理而無法完成此部分, 變通的方法是在每台ESX上面的/etc/hosts都建立要參與的ESX的DN-IP對照表, 唯一麻煩的是若之後新ESX加入, 則原先的ESX上的/etc/hosts全都要再增加此新機器的DN-IP對照.
  5. search domain也要設正確, 也就是要與hostname的Domain的部份相同. 因為根據HA啟用時的log看起來, HA agent僅找尋hostname的前面部分, 若search domain設錯就會導致解不出hostname而導致啟動失敗.




























另外就是啟用成功不代表VM就有受到保護, 還需要滿足以下條件:
  1. 要受保護的VM需要放在share storage上, NFS亦可. 當然, 有與此share storage連線的ESX才有保護能力.
  2. 要受保護的VM所使用到的network(port group)至少要有兩台ESX上有存在, 幾台存在就代表有幾台能保護該VM, 不然因為沒有可用的網路, 備援的ESX沒辦法幫此VM開機,.
目前先想到這些, 日後有發現其他的部份會再補充.

沒有留言:

張貼留言