<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Hypervisor.fr &#187; DRP</title>
	<atom:link href="http://www.hypervisor.fr/?feed=rss2&#038;tag=drp" rel="self" type="application/rss+xml" />
	<link>http://www.hypervisor.fr</link>
	<description>French Bare-Metal weblog</description>
	<lastBuildDate>Wed, 26 Jun 2024 22:42:28 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>La (vraie) recette du stretched cluster avec VMware HA</title>
		<link>http://www.hypervisor.fr/?p=4878</link>
		<comments>http://www.hypervisor.fr/?p=4878#comments</comments>
		<pubDate>Wed, 25 Sep 2013 07:20:50 +0000</pubDate>
		<dc:creator>NiTRo</dc:creator>
				<category><![CDATA[HowTo]]></category>
		<category><![CDATA[Tips & Tricks]]></category>
		<category><![CDATA[VMware]]></category>
		<category><![CDATA[DRP]]></category>
		<category><![CDATA[HA]]></category>
		<category><![CDATA[PowerCLI]]></category>

		<guid isPermaLink="false">http://www.hypervisor.fr/?p=4878</guid>
		<description><![CDATA[Le stretched cluster c&#8217;est un peu l&#8217;ultime fantasme de tous les admin VMware car il permet de couvrir le crash d&#8217;un serveur ou d&#8217;un site avec un seul et même design.
Malheureusement, si vous ne voulez pas investir dans une solution telle que SRM, Zerto ou VPLEX ou encore si vous aspirez à plus de simplicité, le [...]]]></description>
			<content:encoded><![CDATA[<p>Le stretched cluster c&#8217;est un peu l&#8217;ultime fantasme de tous les admin VMware car il permet de <strong>couvrir le crash d&#8217;un serveur ou d&#8217;un site avec un seul et même design</strong>.</p>
<p style="text-align: justify;">Malheureusement, si vous ne voulez pas investir dans une solution telle que <a href="http://www.vmware.com/files/pdf/techpaper/Stretched_Clusters_and_VMware_vCenter_Site_Recovery_Manage_USLTR_Regalix.pdf">SRM</a>, <a href="http://www.zerto.com/">Zerto</a> ou <a href="http://www.emc.com/collateral/software/white-papers/h11065-vplex-with-vmware-ft-ha.pdf" target="_blank">VPLEX</a> ou encore si vous aspirez à plus de simplicité, le failback des VM peut rapidement se transformer en cauchemar (register de vmx à la main par exemple). En effet, depuis vSphere 5.0, <strong>HA (aka FDM) est capable à lui seul d&#8217;assurer le redémarrage des VM (failover) dans un stretched cluster</strong> tant que le stockage d&#8217;un site est répliqué sur l&#8217;autre site et présenté aux ESX après un crash (extrais tiré de <a href="http://www.hypervisor.fr/?page_id=2748" target="_blank">VMware vSphere 5 Clustering Technical Deepdive</a>) :</p>
<blockquote>
<p style="text-align: justify;">The master [agent] will also attempt to take ownership of any datastores it discovers along the way, and it will periodically retry any it could not take ownership of previously.</p>
</blockquote>
<p style="text-align: justify;">Il est donc possible d&#8217;envisager un cluster étendu sur 2 sites où HA serait capable de redémarrer les VM d&#8217;un site crashé après une simple manipulation coté stockage. Après de nombreux tests, il s&#8217;avère que cette solution est parfaitement fonctionnelle mais elle souffre néanmoins d&#8217;un gros problème : le failback. En effet, lorsqu&#8217;il est question de renvoyer les VM sur leur site initial, <strong>il est nécessaire d’arrêter les VM pour re-synchroniser le stockage</strong> et redémarrer les VM sur le site primaire. Lors de cette opération, on se retrouve inévitablement confronté à des VM &#8220;<strong><em>inaccessible</em></strong>&#8221; :</p>
<p style="text-align: justify;"><a href="http://files.hypervisor.fr/img/Stretched_Cluster/failback_inaccessible.png"><img class="aligncenter" src="http://files.hypervisor.fr/img/Stretched_Cluster/failback_inaccessible.png" alt="" width="258" height="226" /></a></p>
<p style="text-align: justify;">A partir de ce moment, il n&#8217;est plus possible de faire autre chose que <strong>d’enregistrer les VM manuellement sur un des ESX (directement)</strong> du site primaire et laisser l&#8217;agent vpx faire le reste. Evidemment, c&#8217;est l&#8217;un des pires scénarios mais il existe des solutions comme celle de faire un storage vmotion pour déplacer les VM sur un autre espace de stockage avant de faire les opérations sur les baies mais bien qu&#8217;il soit possible de faire le failback à chaud dans ce cas, il faut prévoir un espace supplémentaire non négligeable et trop de manipulations à nos yeux.</p>
<p style="text-align: justify;">Après avoir travaillé un certain temps sur le sujet avec notre ami <a href="http://www.vmdude.fr/" target="_blank">vmdude.fr</a>, nous avons trouvé LA solution la plus élégante pour qu&#8217;un passage en production soit envisageable. Elle nécessite quelques manipulations simples et parfaitement scriptables. A vrai dire, la solution était sous notre nez depuis le début et existe depuis longtemps car utilisé dans un autre cas de figure. Il y a même de forte chance pour que vous vous en soyez déjà servi une fois&#8230; <strong>Lorsqu&#8217;une VM est configurée pour ne pas être redémarrée par HA, elle apparaît comme &#8220;disconnected&#8221; tant que l&#8217;ESX n&#8217;est pas redémarré (lui <span style="text-decoration: line-through;">aussi</span> est <span style="text-decoration: line-through;">&#8220;disconnected&#8221; d&#8217;ailleurs</span> &#8220;not responding&#8221;) et dans cet état, vous pouvez démarrer cette VM car vcenter va automatiquement enregistrer la VM ailleurs alors qu&#8217;il ne peut plus communiquer avec l&#8217;ESX pour &#8220;unregister&#8221; la VM</strong>. Nous avons donc utiliser cette fonctionnalité pour &#8220;cacher&#8221; au vcenter les manipulations de stockage en regroupant les VM sur un ESX que l&#8217;on déconnectera avant. Ouvrez grand les yeux :</p>
<p><iframe frameborder="0" width="480" height="270" src="http://www.dailymotion.com/embed/video/x14xa33?autoPlay=1&#038;logo=on&#038;forcedQuality=hd720"></iframe></p>
<p style="text-align: justify;">La liste des commandes PowerCLI utilisées est disponible <a href="http://files.hypervisor.fr/doc/drp_scsi_cmd.txt" target="_blank">ici</a>, elles doivent évidement être modifiées pour correspondre à votre environnement (nom de cluster, ESX et resource pool). Voici un récapitulatif des étapes post crash :</p>
<ul>
<li><strong><span style="color: #ff0000;">&lt;==failover==&gt;</span></strong></li>
<li><em><span style="color: #808080;">présentation du stockage aux ESX</span></em></li>
<li>montage des snapshot VMFS ou des shares NFS</li>
<li><strong><span style="color: #ff0000;">&lt;==failback==&gt;</span></strong></li>
<li>shutdown des VM</li>
<li>move des VM sur l&#8217;ESX helper</li>
<li>enter maintenance mode de l&#8217;ESX helper</li>
<li>disconnect de l&#8217;ESX helper</li>
<li>*disable SIOC*</li>
<li>démontage des snapshot VMFS (ou des share NFS)</li>
<li><em><span style="color: #888888;">failover du stockage</span></em></li>
<li>Power on des VM</li>
<li>reconnect de l&#8217;ESX helper</li>
<li>exit maintenance mode de l&#8217;ESX helper</li>
</ul>
<p style="text-align: justify;">Une autre solution consiste à présenter un petit espace temporairement à tous les ESX (un share NFS est ideal dans ce cas) afin d&#8217;y déplacer uniquement la &#8220;home&#8221; de la VM (vmx, log, etc&#8230;) avec un svmotion scripté afin d’éviter l&#8217;état &#8220;inaccessible&#8221; et pouvoir facilement redémarrer les VM après la re-synchronisation du stockage. L&#8217;avantage est qu&#8217;il n&#8217;est pas nécessaire de &#8220;sacrifier&#8221; un ESX mais cela rajoute des manipulations au PRA et un espace de stockage à gérer en plus.</p>
<p style="text-align: center;"><a href="http://frankdenneman.nl/2012/12/05/overlapping-drs-vm-host-affinity-rule-in-a-vsphere-stretched-cluster/" target="_blank"><img class="aligncenter" src="http://frankdenneman.nl/wp-content/uploads/2012/12/00-Stretched-cluster-architecture.png" alt="" width="504" height="195" /></a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.hypervisor.fr/?feed=rss2&amp;p=4878</wfw:commentRss>
		<slash:comments>8</slash:comments>
		</item>
	</channel>
</rss>
