<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Hypervisor.fr &#187; datastore heartbeat</title>
	<atom:link href="http://www.hypervisor.fr/?feed=rss2&#038;tag=datastore-heartbeat" rel="self" type="application/rss+xml" />
	<link>http://www.hypervisor.fr</link>
	<description>French Bare-Metal weblog</description>
	<lastBuildDate>Wed, 26 Jun 2024 22:42:28 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>VMware HA datastore proxy</title>
		<link>http://www.hypervisor.fr/?p=4944</link>
		<comments>http://www.hypervisor.fr/?p=4944#comments</comments>
		<pubDate>Tue, 03 Dec 2013 08:31:22 +0000</pubDate>
		<dc:creator>NiTRo</dc:creator>
				<category><![CDATA[Tips & Tricks]]></category>
		<category><![CDATA[VMware]]></category>
		<category><![CDATA[datastore heartbeat]]></category>
		<category><![CDATA[FDM]]></category>
		<category><![CDATA[HA]]></category>
		<category><![CDATA[hidden feature]]></category>

		<guid isPermaLink="false">http://www.hypervisor.fr/?p=4944</guid>
		<description><![CDATA[Pendant le setupage du premier super stretched cluster maison en production avec notre cher confrère vmdude.fr, ce dernier a émis une judicieuse remarque sur la possibilité que notre design rende impossible le fonctionnement de Datastore Heartbeat:

When the master host in a vSphere HA cluster can not communicate with a slave host over the management network, the master [...]]]></description>
			<content:encoded><![CDATA[<p style="text-align: justify;">Pendant le <em>setupage</em> du premier <a href="http://www.hypervisor.fr/?p=4878" target="_blank">super stretched cluster maison</a> en production avec notre cher confrère <a href="http://www.vmdude.fr/" target="_blank">vmdude.fr</a>, ce dernier a émis une judicieuse remarque sur la possibilité que notre design rende impossible le fonctionnement de <a href="http://pubs.vmware.com/vsphere-50/topic/com.vmware.vsphere.avail.doc_50/GUID-0502B198-F5F7-4101-969C-C5B6F364C678.html" target="_blank">Datastore Heartbeat</a>:</p>
<blockquote>
<p style="text-align: justify;">When the master host in a vSphere HA cluster can not communicate with a slave host over the management network, <strong>the master host uses datastore heartbeating</strong> to determine whether the slave host has failed, is in a network partition, or is network isolated.</p>
</blockquote>
<p style="text-align: justify;"><strong>Mais qu&#8217;en est il lorsque le master n&#8217;a pas accès au datastore en question ? </strong>C&#8217;est après une bonne séance de tests, en isolant volontairement un ESX du réseau de management, avec décorticage de logs que nous avons trouvé la réponse:</p>
<pre class="brush: bash; title: ; notranslate">
17:31:25.502Z [...] Marking slave host-145 as unreachable
17:31:25.502Z [...] [ClusterDatastore::RemoveMountHost] No longer proxying through host-145 for /vmfs/volumes/404021e9-b4550ea3
17:31:25.502Z [...] Releasing datastore /vmfs/volumes/404021e9-b4550ea3
17:31:25.502Z [...] [InventoryManagerImpl::NotifyDatastoreUnlockedLocally] Invoked for datastore (/vmfs/volumes/404021e9-b4550ea3).
[...]
[...]
17:31:26.513Z [...] [ClusterDatastore::CheckMasterDatastore] Acquiring remote datastore /vmfs/volumes/404021e9-b4550ea3
17:31:26.513Z [...] AcquireViaSlave: Selected slave host-240
17:31:26.513Z [...] AcquireViaSlave: Acquiring from slave host-240
[...]
[...]
17:31:26.614Z [...] [ClusterManagerImpl::ProcessAcquireDatastoreReply] path /vmfs/volumes/404021e9-b4550ea3
[...]
[...]
17:31:30.549Z [...] [ClusterSlave::UnreachableCheck] Waited 5 seconds for icmp ping reply for host host-145
17:31:30.549Z [...] [ClusterSlave::UnreachableCheck] Checking for Partition
[...]
[...]
17:32:08.803Z [...] [ClusterDatastore::ProcessReadHBReply] Failure for /vmfs/volumes/404021e9-b4550ea3 from slave host-240
17:32:08.803Z [...] [ClusterDatastore::UpdateSlaveHeartbeats] (NFS) host-145 @ host-145 is ALIVE
</pre>
<p style="text-align: justify;">Notre interprétation est que l&#8217;ESX que nous avons volontairement isolé (host-145) avait été désigné &#8220;proxy&#8221; car il avait accès à des datastores que le master ne pouvait pas atteindre. Lorsqu&#8217;il n&#8217;a plus été joignable, <strong>un autre slave (host-240) à été choisi pour remonter les informations de datastore heartbeating au master</strong> pouvant ainsi déterminer si le slave (host-145) était mort ou isolé . Grace à <a href="https://twitter.com/DuncanYB" target="_blank">Duncan Epping</a>, nous en avons eu la confirmation :</p>
<blockquote>
<p style="text-align: justify;"><strong>The proxying is designed for a situation where the master cannot see a specific datastore, but slaves can</strong>. In that case the proxy service is used by the master to allow certain actions to take place.</p>
</blockquote>
<p style="text-align: left;"><a href="http://files.hypervisor.fr/img/Stretched_Cluster/datastore_proxy.gif" target="_blank"><img class="aligncenter" src="http://files.hypervisor.fr/img/Stretched_Cluster/datastore_proxy.gif" alt="" width="507" height="372" /></a></p>
<p style="text-align: justify;">Conclusion, même dans un cluster où la moitié des ESX ne sont pas connectés aux datastores de l&#8217;autre moitié, <strong>FDM est capable d&#8217;utiliser un (ou plusieurs ?) slave en tant que proxy pour assurer les fonctions du master</strong>.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.hypervisor.fr/?feed=rss2&amp;p=4944</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
