ESX 3.5 U3, “virtual machine monitoring” bugstory

Comme beaucoup d’autres admins ESX, nous avons souffert du bug de l’option “virtual machine monitoring” de l’update 3 d’ESX 3.5

Pour rappel, cette option est un watchdog de VM qui vérifie de façon plus ou moins régulière la disponibilité des vmtools :

Cette option permet donc de rebooter une vm ayant subit un BSOD, un kernel panic ou si l’OS est devenu trop “bancale”. Très pratique donc.

Malheureusement, l’update 3 d’ESX 3.5 à quelque peut gâchée la fête. En effet, un vmotion vers un host 3.5 U3 “peut” provoquer un reboot de la VM lorsque l’option “virtual machine monitoring” est activée.

Concrètement, les vmtools de la VM ne renvoyait plus de “heartbeat” donc elle était considérée comme HS et un signal de reset était renvoyée à la VM. Démonstration (extrait du vmware.log d’une VM) :

12:35:49.421: vmx| MigrateStateUpdate: Transitioning from state 0 to 7. <– début du VMotion

[...]

12:35:50.132: vmx| MigrateWaitForData: waiting for data.
12:35:50.132: vmx| MigrateStateUpdate: Transitioning from state 7 to 8.
12:35:50.778: vmx| MigrateStateUpdate: Transitioning from state 8 to 9.
12:35:54.892: vmx| MigrateWaitForData: Waited for 4.76 seconds.
12:35:54.892: vmx| MigrateStateUpdate: Transitioning from state 9 to 10.

[...]

12:35:55.438: vcpu-0| MigrateStateUpdate: Transitioning from state 10 to 11.
12:35:55.438: vcpu-0| Migrate_ClearDoneState: cleared state.  State was 11.
<– fin du VMotion
12:35:55.438: vcpu-0| MigrateStateUpdate: Transitioning from state 11 to 0.
12:35:55.438: vcpu-0| Done Sync monModules(4).

[...]

12:38:00.886: vmx| TOOLS received request in VMX to set option ’synctime’ -> ‘1′
12:38:00.893: vmx| VMXVmdb_LoadRawConfig: Loading raw config
12:38:17.867: vmx|
12:38:17.867: vmx|
12:38:17.867: vmx| VMXRequestReset
<– reset de la VM par le virtual machine monitoring

Le patch ESX350-200811401-SG censé résoudre le problème, ne résout malheureusement rien.

Heureusement, comme nous l’avions annoncé dans la news précédente, ce workaround lui fonctionne bien (tests à l’appui).

Faire modifier un fichier manuellement sur X serveurs vi ssh c’est tellement plus fun que de mettre à dispo un vrai patch…

Tags: , , ,

Leave a Reply