In einer speziellen Situation ergab sich die Anforderung, eine virtuelle Maschine unter Hyper-V aus der Verwaltungsdatenbank des System Center Virtual Machine manager 2008 R2 (SCVMM) zu entfernen. Die Konfigurationsdaten der VM in der Datenbank waren nicht mehr aktuell, und aufgrund dieser fehlerhaften Konfiguration weigerte sich SCVMM, irgendetwas mit der VM zu machen. Die virtuelle Maschine selbst lief aber fehlerfrei.
Das Problem: Bei der VM handelte es sich um den SCVMM-Server …
Der Hintergrund war eine schlecht geplante Aktion. Ein Admin hatte versucht, genau diese VM mit der “Speichermigration” auf ein anderes Clustervolume zu verschieben. Diese Speichermigration ist aber keine Live-Migration: Die VM setzt dabei für mehrere Minuten aus. Das wiederum führte natürlich dazu, dass der SCVMM-Dienst nicht mehr erreichbar war. Im Effekt schlug der Verschiebevorgang fehl.
Der VM selbst machte das nichts: Da der Vorgang eine Transaktion darstellt, war die VM hinterher noch an ihrem alten Platz und lief anstandslos weiter. Nur innerhalb der SCVMM-Datenbank war vermerkt, dass der letzte Vorgang fehlgeschlagen war. Die Konfigurationsdaten standen nun aber falsch in der Datenbank, denn sie zeigten auf den “neuen” Speicherort, an den die VM aber gar nicht verschoben worden war.
Hier war guter Rat etwas teurer. Die VM aus dem SCVMM zu löschen, funktionierte nicht: Zum einen löscht SCVMM dabei auch die VHD-Dateien von den Platten des Hosts. Zum anderen bricht der Vorgang natürlich ab, weil SCVMM die virtuelle Maschine beendet und in diesem Fall wieder den Kontakt zu seinem eigenen Dienst verliert …
Abhilfe schaffte der folgende KB-Artikel:
[You cannot delete a missing VM in SCVMM 2008 or in SCVMM 2008 R2]
http://support.microsoft.com/kb/983839/en-us
Dort steht ein anderes Szenario im Hintergrund: In dem Artikel sollen VMs mit dem Status “Missing” aus der Datenbank entfernt werden, welcher durch andere fehlerhafte Vorgänge entstehen kann. Dazu ist ein SQL-Skript notwendig, das direkt in der VMM-Datenbank die zugehörigen Einträge löscht. Operation am offenen Herzen also …
Ein Blick auf das SQL-Skript nährte die Hoffnung, dass es auch in diesem Fall einsetzbar ist. Es löscht alle VMs aus der Datenbank, die den Status “220” haben (Missing). In meinem Fall war der Status “107”, wie ich durch einen Blick in die Tabelle “tbl_WLC_VObject” der VMM-Datenbank herausfand.
Ich stoppte also den VMM-Dienst auf dem SCVMM-Server, kopierte das Skript in den SQL-Manager und änderte in der vierten Zeile den Wert “220” in “107”. Das Skript brauchte nur wenige Sekunden. Nach Neustart des VMM-Dienstes war die fehlerhafte VM aus der Anzeige verschwunden.
Um die VM nun wieder in den VMM einzubinden, öffnete ich die Eigenschaften des Hosts, auf dem die VM lief. Unter “VMs” klickte ich auf “Durchsuchen”§ und wählte den tatsächlichen Speicherpfad der VM-Dateien aus. Danach war es erforderlich, den Host per Rechtsklick im VMM zu aktualisieren. Danach war die VM wieder korrekt eingebunden und verwaltbar.
Achtung: Dieses Verfahren ist nur auf eigene Gefahr einzusetzen! Ich übernehme keinerlei Verantwortung oder Support dafür!
Ein vergleichbares Problem mit einem ähnlichen Lösungsansatz beschreibt Michel Lüscher hier:
[Error “The cluster group could not be found” in Virtual Machine Manager | Server Talk]
http://www.server-talk.eu/2010/08/14/error-the-cluster-group-could-not-be-found-in-virtual-machine-manager/
http://faq-o-matic.net/?p=2536