Reduzierung der Storage TCO mit der Data Management Engine 2.0

2021-12-15

Peter Kruth

Executive Solution Principal
Huawei Deutschland

Pit’s IT Architecture Talk

#20 Reduzierung der Storage TCO mit der Data Management Engine 2.0

Hinweis: Die in diesem Artikel zum Ausdruck gebrachten Ansichten und Meinungen sind die des Autors und spiegeln nicht notwendigerweise die offizielle Politik, Position, Produkte und Technologien der Huawei Deutschland GmbH wieder. Wenn Sie mehr über die Produkte und Technologien der Huawei Technologies Deutschland GmbH erfahren möchten, besuchen Sie bitte unsere Produktseiten oder kontaktieren Sie uns.

Die Total Cost of Ownership (TCO) ist ein wesentlicher Faktor bei der Beschaffung von Storage-Systemen. Mit einem durchgängigen und effizienten Management kann diese wesentlich reduziert werden.

Viele Leser werden mir zustimmen, dass TCO – Vergleiche oft Betrachtungen zwischen Äpfeln und Birnen sind. Wie bei jeder Statistik, sollte man die Ziele im Auge behalten. Dies sollte uns allerdings nicht davon abhalten, diese Werkzeuge mit der notwendigen Transparenz einzusetzen.

Oft werden bei den TCO-Betrachtungen wesentliche Kosten außen vor gelassen. Nehmen wir als Beispiel 1 PB Storage. Zuerst entstehen die Beschaffungskosten. Gehen wir der Einfachheit halber von 1.000.000 Euro bei 5 Jahren Service und Support aus. Dazu kommen anschließend die Rechenzentrums-Kosten, wie Strom, Kühlung, Platzbedarf etc. Jetzt fehlen aber noch zwei wesentliche Punkte. Dies sind zum einen die Personalkosten für den Betrieb und die Ausfallkosten.

Die Personalkosten sind relativ einfach zu ermitteln. Nehmen wir 5 Personen im Storage-Team a 100.000 Euro pro Jahr. Das sind auf 5 Jahre schon 2.500.000 Euro. Bei den Ausfallkosten ist es schon etwas schwieriger. Diese müssen sehr individuell ermittelt werden. Als einfaches Beispiel könnte man eine VDI-Umgebung mit 1000 aktiven Anwendern (24x7) betrachten. Wenn wir wieder von 100.000 Euro jährlichen Kosten pro Anwender ausgehen, ergibt dies ca. 1 Euro pro Minute je Anwender. Fällt die Anwendung jetzt für eine Stunde je Jahr aus (Verfügbarkeit ∽99,99%), sind dies schon weitere 300.000 Euro in 5 Jahren. Was wir hier noch nicht eingerechnet haben, sind ggf. der Reputationsverlust und der Verlust durch ausgefallene Geschäfte. Diese Kosten sind also beträchtlich höher. Als Beispiel können wir einen verlorenen Auftrag in Höhe von 100.000 Euro je Jahr einsetzen.

	Kosten, 5 Jahre in Euro	Prozent
Beschaffung	1.000.000	23
RZ (10 HE) – herkömmliche Technologien	36.000	1
Personal O/M	2.500.000	58
Ausfall 1 Stunde jährlich (99,99%)	800.000	18
gesamt	4.336.000

Beispielkosten 1PB – Storage über 5 Jahre

3 Bereiche tragen zu den Gesamtkosten wesentlich bei. Erstens die Beschaffungskosten, zweitens die Ausfallkosten und drittens die Personalkosten für den Betrieb.

Bei den Beschaffungskosten sind nur geringe Einsparungen zu erwarten. Anders sieht es bei den Personalkosten und den Ausfallkosten aus. Diese 76% der Kosten lassen sich mit einem einfachen, automatisierten und KI-gestützten Storage-Management erheblich reduzieren. Ein einzelnes Storage-System kann, zumindest bei uns, relativ einfach betrieben werden. Wenn man aber mehrere Systeme, vielleicht auch noch von unterschiedlichen Herstellern, betreibt, sieht die Welt schon ganz anders aus.

Für dieses heterogene Storage-Management haben wir unsere Data Management Engine (DME) entwickelt. Dieses Produkt ist übrigens gerade in der Version 2.0 erschienen.

Abbildung 1: DME 2.0 Übersicht

Ein herausragendes Produktmerkmal ist die einfache Bedienung. Was hilft ein Werkzeug, wenn man sich Tage oder Wochen einarbeiten muss oder beim täglichen Umgang frustriert ist. Wir setzen auf eine intuitive HTML5-Oberfläche mit integrierten Wizards, einem umfangreichen Berechtigungsmanagement mit Anbindung an typische Verzeichnisdienste, eine umfangreiche API, Ende-zu-Ende Ansichten und flexibles Reporting.

Abbildung 2: Ende zu Ende Ansicht

Gerade der letzte Punkt ist für die Praxis äußerst interessant. So lassen sich individuelle Reports oder sogar Bereitstellungsprozesse für die jeweilige Anwendungs-Administration freischalten.

In diesem Zusammenhang sollte die KI-gestützte Root-Cause-Analyse nicht unerwähnt bleiben. Nicht nur, dass sie Fehler frühzeitig voraussagen kann, was die Verfügbarkeit der Gesamtumgebung erhöht, sondern auch, dass sie Fehlermeldungen entsprechend zusammenfasst.

Abbildung 3: Alarme werden zusammengefasst

Damit lassen sich Folgefehler Ende-zu-Ende übersichtlich gruppieren, die tatsächliche Fehlerursache viel schneller erkennen und Benachrichtigungen auf das Wesentliche reduzieren.

Die Voraussage von Fehlern ist ein absolutes Highlight und basiert auf KI-gestützten Prozessen, siehe folgende Abbildung.

Abbildung 4: Fehlervorhersage

Damit liegt die Vorhersagezeit z.B. für Diskausfälle bei 14 Tagen, bei Leistungseinbrüchen bei 60 Tagen und für die Kapazitätsentwicklung bis zu einem Jahr.

Eine weitere Neuerung ist das visuell gestützte Copy-Management. Damit wird die Datenreplikation, Snapshots und Clones übersichtlich dargestellt und Platzverschwendung vorgebeugt. Zudem können über ein Benutzerinterface komplette DR- und Backup-Abläufe oder Entwicklungs- und Testprozesse automatisiert werden. Das beinhaltet das Erstellen von Kopien (Snapshots), das Konfigurieren des Storage-Netzwerkes, die Synchronisierung zu anderen Systemen, das Abtrennen der Kopien und das vollständige Einbinden der Ressourcen in das jeweilige Host-Betriebssystem. Dies funktioniert nicht nur im lokalen oder entfernten Rechenzentrum, sondern auch in der Cloud.

Alle diese Aufgaben können vorkonfiguriert und später ausgeführt werden. Dazu lassen sich Workflows einrichten, die Kontroll- und Genehmigungs-Schritte beinhalten können.

Auch wenn nur einige Highlights dargestellt wurden, sieht man das Potenzial von DME für heterogenes Storage-Management und die Möglichkeiten die Storage-TCO an den wesentlichen Kostenfaktoren erheblich zu reduzieren. Zudem kann kostbares IT-Personal im Rahmen der Digitalisierung gewinnbringender eingesetzt werden.

Bis bald!

Pit

Other Blogs

Peter Kruth

Executive Solution Principal
Huawei Deutschland

Unternehmen

Huawei Cloud

Carrier

Konsumenten

Huawei

Reduzierung der Storage TCO mit der Data Management Engine 2.0

#20 Reduzierung der Storage TCO mit der Data Management Engine 2.0