Suche

Warum sind autonome Rechenzentren unausweichlich?

2021-02-22
427
0

Pit’s IT Architecture Talk

#3 Warum sind autonome Rechenzentren unausweichlich?

Hinweis: Die in diesem Artikel zum Ausdruck gebrachten Ansichten und Meinungen sind die des Autors und spiegeln nicht notwendigerweise die offizielle Politik, Position, Produkte und Technologien der Huawei Deutschland GmbH wider. Wenn Sie mehr über die Produkte und Technologien der Huawei Deutschland GmbH erfahren möchten, besuchen Sie bitte unsere Produktseiten oder kontaktieren Sie uns.

In meinen letzten beiden Beiträgen in dieser Reihe, habe ich sehr detailliert auf unsere IT-Welt geschaut. Heute geht es mehr um die Vogelperspektive.

Wenn man Entwicklungen in der IT-Branche voraussagen möchte, könnte sich die Sicht auf länger etablierte Industriebereiche lohnen. Dazu beziehe ich mich auf den Maschinenbau – schließlich habe ich das mal zusammen mit Elektrotechnik und Elektronik studiert. Zudem hat der Maschinenbau die erste und zweite technische Revolutionen eingeleitet. Auch bei dieser Industrie steht das Ziel, die Effizienz zu steigern, im Vordergrund.

Typisch im Maschinenbau war früher eine manuelle Produktion. Diese wurde später in eine Manufaktur überführt. Dabei wurden die Arbeitsschritte auf jeweils spezialisierte Teams aufgeteilt. Nach der Manufaktur wurde die Fließbandfertigung etabliert. Hier wurden die Produktionsschritte, gegenüber der Manufaktur, weiter verfeinert, so dass an jeder Station nur noch wenige Tätigkeiten bzw. nur noch ein Handgriff ausgeführt wurde. Anschließend wurden diese Einzelschritte, mit Hilfe der Robotik, modernisiert, so dass wir heute vollständig automatisierte Produktionsstraßen vorfinden.

Und jetzt schließt sich der Kreis zur IT wieder. Mit dem Projekt Industrie 4.0 werden nicht mehr einzelne Produktionsabschnitte betrachtet, sondern ganze Wertschöpfungsketten durch Digitalisierung optimiert. Die Autonomie ist ein wesentliches Ziel davon, d.h. das System trifft selbständig wesentliche Entscheidungen.

Ein gutes Beispiel hierfür ist der Kauf und die Lieferung eines Industrieproduktes – nehmen wir ein Auto. Zuerst wird über ein Self-Service-Portal das gewünschte Modell konfiguriert und bestellt. Die Konfigurationsdaten werden an ein Werk übermittelt, das Auto wird gebaut, eine Spedition wird beauftragt und das Fahrzeug ausgeliefert und vom Kunden bezahlt.

Theoretisch wird, außer in der Person des Kunden, im gesamten Prozess kein Mensch benötigt. Dazu müssen aber wesentliche Entscheidungen selbständig getroffen werden. Beispiele dafür sind die Kreditwürdigkeit des Kunden, die Verfügbarkeit der notwendigen Komponenten, die verfügbare Produktionskapazität, der Lieferort und Zeitpunkt usw.

Vergleichen wir das jetzt mit der IT-Infrastruktur. Sie ist ja der wesentliche physische Teil eines Rechenzentrums.

Zuerst wurden die einzelnen Komponenten, Compute, Netzwerk, Storage und Backup, vom Administrator manuell konfiguriert und betrieben. Später fand eine Spezialisierung statt, in dem die Technologiebereiche aufgeteilt wurden in Server-, Netzwerk-, Storage- und Backup-Administration – quasi die Manufaktur.

Danach wurden die einzelnen Bereiche automatisiert und wir haben das heute angestrebte Cloudcomputing. Über ein Self-Service-Portal können Services bestellt werden, die anschließend automatisiert bereitgestellt und abgerechnet werden. Dies entspricht den automatisierten Fertigungsstraßen im Fahrzeugbau.

Und der nächste Schritt ist? – Autonomie, sprich Cloud 2.0 oder ich würde sogar sagen IT 4.0!

  • IT 1.0 Großrechner
  • IT 2.0 Client/Server
  • IT 3.0 Cloud
  • IT 4.0 Autonome IT

Tatsächlich werden auch beim Cloudcomputing noch viele Schritte manuell ausgeführt. Denken wir an Monitoring, Patchmanagement, Ressourcenoptimierung, Fehlerbehebung, Systemerweiterung, Hardwareaustausch, Ressourcenplanung, Beschaffung, Entsorgung, Weiterentwicklung und noch viele andere Gebiete. Dabei habe ich das Gebäude, die Stromversorgung, Klima/Lüftung und Racks noch gar nicht berücksichtigt. Da sind noch ganze Völkerstämme mit beschäftigt und wir haben viel Raum für Innovation.

Und was trägt Huawei zur Autonomie des Rechenzentrums bei?

Da könnt ihr ganz gespannt sein. Mein IT-Herz springt vor Freude im Dreieck.

Fangen wir mit dem Gebäude an. Wusstet ihr, dass wir komplette Rechenzentren für unsere Kunden einrichten?

Schaut doch mal unter Datencenter bei uns vorbei. Die Datencenter-Trends findet ihr hier. Und was steht dort unter Trend 5: „Full Digitalization and AI-enablement“. Kling genau nach IT 4.0.

Und genau das haben wir schon, mit dem Einsatz von IoT und künstlicher Intelligenz (KI), entwickelt. Das Ergebnis ist die Steigerung der Effizienz, wie verkürzte Bereitstellungszeit, spürbar geringere Energiekosten (Strom und Klima), höhere Stabilität und geringerer Personalbedarf neben einigen anderen.

Das aber nur nebenbei. Wie ihr wisst, ist mein Steckenpferd IT-Infrastruktur. Fangen wir mit dem Netzwerk an. Ausfälle im Netzwerk kennt jeder. Es wird eine Komponente konfiguriert oder aktualisiert und schon steht alles. Selbst die großen Hyperscaler kommen regelmäßig in die Schlagzeilen, weil zentrale Netzwerkservices ausfallen und dann nichts mehr geht. Dagegen haben wir unsere AI-Fabric. Das Netzwerk optimiert sich mittels KI selbst, erkennt Fehler und behebt diese gleich. Selbst bei Planung, Installation, Betrieb und Monitoring unterstütz KI-basierte Software und verhindert so Fehler bevor sie implementiert werden. Dazu nutzen wir einen digital Twin, welcher automatisch aus den Echtzeitdaten erstellt wird. Das Ergebnis ist die Steigerung der Effizienz, keine Paketverluste, geringe Latenz, höhere Verfügbarkeit, geringerer Personalbedarf und niedrigere Kosten. Wer Blut geleckt hat, für den könnte auch noch folgende Studie interessant sein „Leveraging the Autonomous Driving Datacenter Network Index“.

Vergleichbare Technologien setzen wir auch im Storagebereich ein. Was uns hier von vielen unterscheidet ist, dass wir nicht nur vorausschauende Instandsetzung betreiben oder einzelne Aufgaben im Storagesystem optimieren. Wir haben einen vollautomatisierten Kreislauf und benötigen i.d.R. keine manuellen Eingriffe mehr. In der Cloud werden dazu Daten gesammelt und online zum Training des KI-Modells genutzt. Anschließend wird das jeweilige Modell zu den Managementsystemen und den Storage-Controllern übertragen und dort auf dedizierten KI-Prozessoren ausgeführt (Inferenz). Wenn man es so will, lernen unsere Storagesysteme voneinander und werden mit der Zeit immer intelligenter. Das ist echte Autonomie!

Auch im Computebereich verwenden wir diese Technologie und gestalten immer mehr Prozesse autonom. Hier setzen wir auf vorbeugende Instandsetzung und können Fehler mit einer Genauigkeit von 93% und bis zu 30 Tagen vorher voraussagen. Sehr interessant ist eine Lösung, wie wir lastabhängig den Energieverbrauch der Computesysteme regulieren. Dabei werden nicht nur die Prozessoren gedrosselt, das kann ja jeder, sondern die energieintensiven Komponenten in den Schlafmodus versetzt. Das reduziert nicht nur die Energiekosten sondern schont auch unsere Umwelt.

Dies sind nur einige Beispiele, wie wir Autonomie in das Rechenzentrum bringen. Sicher, da ist noch einiges zu tun aber wir haben schon eine ganze Menge erreicht. Huawei hat hier einen entscheidenden Vorteil. Wir produzieren nicht nur Spitzentechnologie, sondern wir wenden sie in unserer Huawei Cloud, auf breiter Basis, an. Gleichzeitig bekommen wir aus dem Cloud-Betrieb wieder Ideen für die nächsten Innovationen. Und für unsere Kunden bedeutet das, dass sie erprobte und effiziente Spitzentechnologien bekommen, die nicht erst bei ihnen reifen müssen.

Bis bald!

Pit




TOP