Blog
Tuesday, 31. March 2020

Docker: Persistente Daten und Volumen

Simon
IT-Consultant

Da Docker Container unveränderlich und vergänglich sind, geben sie uns die Möglichkeit, im Falle einer Konfigurationsänderung oder eines Upgrades der Containerversion, einen neuen Container bereit zu stellen und den veralteten zu verwerfen, anstatt diesen neu zu konfigurieren. Dieses Konzept einer unveränderlichen Infrastruktur, in welcher Dinge nicht mehr geändert werden, sobald sie ausgeführt werden, bringt enorme Vorteile im Bezug auf Zuverlässigkeit und Konsistenz sowie die Reproduzierbarkeit von Änderungen.

Doch diese Vorteile kommen nicht ohne einen Kompromiss: Docker Container sind persistent. Das bedeutet, dass Änderungen und Konfigurationen eines Containers im Falle eines Neustarts des Hosts oder des Containers, erhalten bleiben. Nach dem tatsächlichen Löschen eines Containers gehen diese Änderungen aber verloren gehen. Doch was ist, wenn eine Anwendung innerhalb eines Containers einzigartige Daten erzeugt, wie beispielsweise Datenbanken oder einen Schlüsselwertspeicher? Wie können wir diese essentiellen Daten im Falle einer Aktualisierung und dem Bereitstellen eines neuen Containers behalten, wenn wir doch den alten löschen?

Hierfür bietet Docker zwei Lösungen: Data Volumes und Bindmounts. In diesem Beitrag wollen wir uns die Verwendung von Data Volumes genauer anschauen und an einem praktischen Beispiel verdeutlichen.

Die Verwendung eines Data-Volumes

Ein Data-Volume eines Containers bietet die Möglichkeit, Daten, die innerhalb eines Containers ‘leben’, einsehen und weiterhin verwenden zu können, auch wenn sie bereits gelöscht wurden. Hierfür wird ein ein Pfad innerhalb des Containers konfiguriert, der auf einen tatsächlichen Pfad auf dem Host zeigt, in dem die Daten dauerhaft gespeichert sind. Um besser zu verstehen wie das funktioniert schauen wir uns in den folgenden Abschnitten einen Container mit einem konfigurierten Data Volume an.

Data Volumes werden für einen Docker Container in dem zugehörigen Dockerfile mithilfe des Schlüsselworts “VOLUME” konfiguriert. Zur Veranschaulichung betrachten wir einmal das Dockerfile des offiziellen msql Docker-Images. Dieses ist auf der Internet Seite Docker Hub unter https://hub.docker.com/_/mysql frei einsehbar.

Wir betrachten nun einen Auszug des Dockerfiles und finden in der Tat das konfigurierte Volume:

Mainzer Datenfabrik - Docker: Persistente Daten und Volumen

Diese Konfiguration gibt dem Container beim Start die Anweisung, einen tatsächlichen Volume-Speicherort zu erstellen und dieses dem Verzeichnis /var/lib/mysql innerhalb des Containers zuzuweisen. Dies hat zur Folge, dass alle Daten, die innerhalb des Containers abgelegt sind, die Lebenszeit des Containers überdauern und auch noch nach dem Entfernen des Containers erhalten bleiben. Nur durch manuelles Löschen des Volumes können die Daten entfernt werden.

Schauen wir uns nun einmal das Image selbst an. Hierfür laden wir uns das Image mit dem Befehl

docker pull mysql

herunter. Nach dem Download können wir uns mit dem Befehl

docker image inspect mysql

die genaue Konfiguration des Images ansehen. Und auch hier können wir das im Dockerfile konfigurierte Volume finden:

Mainzer Datenfabrik - Docker: Persistente Daten und Volumen

Mit dem Befehl

docker container run -d --name test MYSQL_ALLOW_EMPTY_PASSWORD=True mysql

erstellen wir nun einen Container, basierend auf dem zuvor heruntergeladenen mysql Image. Nach dem Erstellen des Containers können wir mit dem Befehl

docker container inspect test

nun die Konfiguration des Containers ansehen. Auch hier finden wir das konfigurierte Volumen:

Mainzer Datenfabrik - Docker: Persistente Daten und Volumen

Allerdings können wir hier noch deutlich mehr Informationen zu dem spezifizierten Volumen finden. Betrachten wir hierfür den Abschnitt ‘Mounts’:

Mainzer Datenfabrik - Docker: Persistente Daten und Volumen

Hier wird nun der tatsächliche Speicherort der Daten auf dem Host konfiguriert. Die sehr lange Zeichenkette hinter ‘Source’ bezeichnet den tatsächlichen Speicherort der Daten auf dem Host. Daten, die also innerhalb des Containers unter dem spezifizierten Volumen /var/lib/mysql abgelegt werden, werden tatsächlich auf dem Host in dem hier erstellten Directory gespeichert.

Wir haben nun also sowohl das Volumen, als auch den Pfad selbst gesehen, in welchem Docker Daten ablegt. Nun wird verdeutlicht, dass diese Daten auch bestehen bleiben, wenn der Container gelöscht wird.

Wir erstellen nun einen zweiten Container mit dem Namen test2. Mit dem Kommando

docker container ls
Mainzer Datenfabrik - Docker: Persistente Daten und Volumen

können wir nun unsere laufenden Container einsehen.

Mit dem Kommando

docker volume ls
Mainzer Datenfabrik - Docker: Persistente Daten und Volumen

können wir unsere existierenden Volumes einsehen.

Löschen wir nun unsere beiden Container mit dem Kommando

docker contianer rm test test2

und betrachten erneut unsere Volumes, stellen wir fest, dass diese immer noch existieren. Unsere Daten gehen also auch beim Löschen eines Containers nicht verloren.

Mainzer Datenfabrik - Docker: Persistente Daten und Volumen

Nun haben wir allerdings noch das Problem, dass wir unsere Volumen aufgrund ihrer sehr komplizierten Namen nicht gut auseinander halten können. Hierfür können wir nun ‘named volumes’ verwenden und unseren Volumes eigene Namen geben

Mit dem Kommando

docker container run -d --name test -e MYSQL_ALLOW_EMPTY_PASSWORD=True -v mysql_volume:/var/lib/mysql mysql

können wir einen neuen mysql Container erstellen und dem vorkonfigurierten Volume einen Namen geben:

Mainzer Datenfabrik - Docker: Persistente Daten und Volumen

Fazit

Volumes bieten eine sehr gute Möglichkeit, wichtige Daten auch nach dem Ableben eines Containers, zu behalten und in folgenden Containern weiterhin zu verwenden. Mit der Möglichkeit, dem Volumen einen Namen zu geben, können sensible Daten einfach überwacht und verwaltet werden.

Führt man auf einem Container also Anwendungen aus, welche einzigartige Daten erzeugen, die auch beim Wechsel auf eine aktualisierte Version erhalten bleiben sollen, sind Volumes die beste Wahl.

Interesse geweckt?

Unsere Expert:innen stehen Ihnen bei allen Fragen rund um Ihre IT Infrastruktur zur Seite.

Kontaktieren Sie uns gerne über das Kontaktformular und vereinbaren ein unverbindliches Beratungsgespräch mit unseren Berater:innen zur Bedarfsevaluierung. Gemeinsam optimieren wir Ihre Umgebung und steigern Ihre Performance!
Wir freuen uns auf Ihre Kontaktaufnahme!

Taunusstraße 72
55118 Mainz
info@madafa.de
+49 6131 3331612
Bürozeiten
Montag bis Donnerstag:
9:00 - 17:00 Uhr MEZ

Freitags:
9:30 - 14:00 Uhr MEZ