vSAN-Health-Dienst startet nicht

In der Arbeit mit Virtualisierungssoftwares wie z.B. mit vSAN kann es immer wieder zu Problemen und Schwierigkeiten kommen. vSAN ist eine Storage-Virtualisierungssoftware, die Storage und Computing über eine zentral integrierte Platform verwaltet. Sie wird als Teil des EXSi-Hypervisors ausgeführt.

Ein immer häufiger vorkommendes Problem mit vSAN ist, dass der vSAN-Health Dienst nicht startet. Wir helfen Ihnen mit diesem Artikel beim Troubleshooting.

Folgende Fehlermeldungen können auftreten:

  • Beim Versuch einen Backup Job über die vCenter Server Apliance-VAMI zu erstellen, erreicht uns diese Fehlermeldung:
Invalid vCenter Server Status: All required services are not up! Stopped services: 'vsan-health'.
  • Das Einrichten einer VM Konfiguration für vSphere Replication schlägt fehl:
Operation Failed
A generic error occurred in the vSphere Replication Management Server. Exception details: 'Unexpected status code: 503'.
Operation ID: 3be4d590-8170-40e8-b4ae-14bf8258e3de
  • Möglicherweise startet der vSAN-Health Dienst nicht, folgende Stack-Trace wird ausgegeben:
service-control --start vmware-vsan-health
Operation not cancellable. Please wait for it to finish...
Performing start operation on service vsan-health...
Error executing start on service vsan-health. Details {
    "problemId": null,
    "detail": [
        {
            "args": [
                "vsan-health"
            ],
            "id": "install.ciscommon.service.failstart",
            "translatable": "An error occurred while starting service '%(0)s'",
            "localized": "An error occurred while starting service 'vsan-health'"
        }
    ],
    "resolution": null,
    "componentKey": null
}
Service-control failed. Error: {
    "problemId": null,
    "detail": [
        {
            "args": [
                "vsan-health"
            ],
            "id": "install.ciscommon.service.failstart",
            "translatable": "An error occurred while starting service '%(0)s'",
            "localized": "An error occurred while starting service 'vsan-health'"
        }
    ],
    "resolution": null,
    "componentKey": null
}

/var/log/vmware/vsan/-health/vmware-vsan-health-runtime.log.stderr log reports an error as below.
Starting service process with pid: 53357.
Traceback (most recent call last):
  File "/usr/lib/vmware-vpx/vsan-health/VsanVcMgmtd.py", line 9, in
    os.initgroups(entry.pw_name, entry.pw_gid)
PermissionError: [Errno 1] Operation not permitted

Bei jedem neuen Versuch, den Dienst zu starten, wird die Änderung der PID in vmware-vsan-health-runtime.log.stderr wiedergegeben und der Dienst bleibt weiterhin gestoppt.

Mögliche Ursachen könnten sein:

  • Der vsan-health-Dienst wird mit dem Root-Konto gestartet.
  • Der Dienst war deaktiviert und gleichzeitig das Upgrade auf 6.7 U3 erfolgreich.
  • Dienst-Eigenschafts- und json-Dateien können das erforderliche Attribut nicht aktualisieren.

Risiko

  • Das VAMI Backup wird fehlerhaft durchgeführt.
  • Die VM-Konfiguration für die vSphere Replikation kann nicht erstellt werden.

Lösungswege:

  • Erstellen Sie einen Snapshot der vCenter Server Appliance.
  • Öffnen Sie eine SSH Sitzung mittels vCenter Server Appliance.
  • Navigieren Sie zu ‘etc/vmware/vmware-vmon/svcCfgfiles/‘:
cd /etc/vmware/vmware-vmon/svcCfgfiles/
  • Verwenden Sie folgenden Code, um versteckte Dateien sichtbar zu machen:
ls -la
  • Erstellen Sie eine Kopie von .state_vsan-health.json außerhalb des svcCfgfiles Ordners :
cp .state_vsan-health.json ../.state_vsan-health.json
  • Löschen Sie ‘/etc/vmware/vmware-vmon/svcCfgfiles/.state_vsan-health.json
rm /etc/vmware/vmware-vmon/svcCfgfiles/.state_vsan-health.json
  • Navigieren Sie zu ‘/usr/lib/vmware-vmon‘:
cd /usr/lib/vmware-vmon
  • Führen Sie folgenden Befehl aus:
vmon-cli -U vsan-health -R root
  • Starten Sie den Dienst neu mit folgendem Befehl:
service-control --start vmware-vsan-health

Sie sollten nun in der Lage sein, Ihren vSAN Health Dienst erneut und ohne Fehlermeldung starten zu können.