Wyszukaj

Uwolnienie mocy obliczeniowej dzięki technologii w pełni Ethernet w hiperkonwergentnym rozwiązaniu DCN CloudFabric 3.0 Huawei

2021-07-02
772
0

Niegdyś stanowiła kamień węgielny ery przemysłowej, dziś energia elektryczna znalazła się na drugim miejscu, ustępując komputerom, które spełniają równoważną rolę w dzisiejszym cyfrowym świecie. Moc obliczeniowa jest oczywiście napędzana przez centra danych, które przechowują, analizują i obliczają ogromne ilości danych w całym cyklu życia danych.

Aby lepiej wydobyć wartość z danych, większy nacisk kładzie się na osiąganie coraz większej mocy obliczeniowej. Jednak samo zwiększenie skali sieci centrów danych (DCN) w pogoni za takim wzrostem już nie wystarcza. W rzeczywistości siła DCN polega obecnie na jego mocy obliczeniowej.

Konwergencja jest nieunikniona w dążeniu do szybszego przepływu danych i obsługi danych

Moc obliczeniowa jest zwykle wykorzystywana do oceny zakresu, w jakim serwer przetwarza dane oraz w jakim stopniu zasoby obliczeniowe, pamięciowe i sieciowe są zorganizowane wspólnie. Krótko mówiąc, aby zapewnić wysoką moc obliczeniową, sieci DCN łączące różne rodzaje zasobów centrum danych muszą zapewniać wydajny i płynny przepływ danych.

W zależności od podłączonych zasobów sieci DCN są podzielone na trzy kluczowe kategorie. Sieci komputerowe ogólnego przeznaczenia świadczą usługi dla zewnętrznych terminali użytkowników. Sieci pamięci masowej są odpowiedzialne za przechowywanie, odczyt i zapis oraz tworzenie kopii zapasowych danych. Sieci o wysokiej wydajności (HPC) łączą serwery jednostki centralnej (CPU) i procesora graficznego (GPU) w celu przeprowadzania szkoleń z zakresu HPC i sztucznej inteligencji (AI).

Aby przyspieszyć przepływ i obsługę danych, te trzy typy sieci muszą ze sobą współpracować. Tylko wtedy moc komputera może osiągnąć swój prawdziwy potencjał. Jednak są one oparte na różnych protokołach. W szczególności sieci obliczeniowe ogólnego przeznaczenia są zwykle budowane w oparciu o otwarty protokół Ethernet, podczas gdy Fibre Channel (FC) i InfiniBand (IB) są przystosowane do budowy odpowiednio konwencjonalnych scentralizowanych sieci pamięci masowej i sieci HPC. Dzięki trzem architekturom sieci silosowej poświęca się moc obliczeniową i przepływ danych. Trzeba jednak osiągnąć zbieżność sieci.

Sieci DCN zbliżają się do sieci w pełni Ethernet, tworząc możliwości konwergencji

DCN pobudzają żywotność aplikacji w chmurze oraz zasobów obliczeniowych i pamięci masowej, przyspieszając transformację. To z kolei skłania DCN do przyjęcia sieci w pełni Ethernet. W rezultacie aplikacje i zasoby przechodzą trzy główne przeobrażenia.

Aktualizacja w chmurze: w miarę migracji usług branżowych do chmury architektura informatyczna (IT) przedsiębiorstw, dużych i małych, ewoluuje z lokalnie scentralizowanych do rozproszonych, w jednej lub nawet wielu chmurach. Architektura Open Ethernet jest wysoce interoperacyjna, skalowalna i elastyczna oraz może być elastycznie wywoływana przez chmurę, zapewniając jednocześnie wysoki poziom bezpieczeństwa w scenariuszach z wieloma dzierżawcami. Czynniki te ostatecznie pozycjonują Ethernet jako doskonały wybór do budowy sieci komputerowych ogólnego przeznaczenia.

Pamięć masowa flash: wraz z modernizacją dysków twardych (HDD) w kierunku technologii flash wydajność odczytu i zapisu nośników pamięci masowej wzrasta o współczynnik 100. Przekracza to górny limit przepustowości – 32G i 64G – sieci FC, co rodzi nowe pytanie: w jaki sposób czy można najlepiej spełnić wymagania dotyczące przepustowości ery flash? Aby znaleźć odpowiedź, branża zwróciła uwagę na Ethernet, który może zapewnić przepustowość do 400 GE, a zatem służyć jako nowy standard dla sieci pamięci masowej nowej generacji.

Wymiana PCIe: aby przezwyciężyć ograniczenia prędkości magistrali i zapewnić wyższą moc obliczeniową, niektórzy dostawcy procesorów i GPU zastępują magistralę Peripheral Component Interconnect express (PCIe) połączeniem Remote Direct Memory Access over Converged Ethernet (RoCE).

Aby w pełni wykorzystać zachodzące przemiany, stało się jasne, że obecnie najlepszym podejściem jest przyjęcie sieci Ethernet. Zgodnie z listą TOP500, która klasyfikuje superkomputery na całym świecie, Ethernet zastąpił IB i faktycznie jest standardem od 2016 r. Istotnie, w 2019 r. Intel wstrzymał rozwój swojego Omni-Path 200 Fabric. W 2021 r. firma wprowadziła na rynek przełączniki Ethernet dostosowane do scenariuszy HPC. Ponadto, dzięki nowym specyfikacjom testowym i standardom, które zostały wydane zgodnie z rozwojem sieci Ethernet DCN, nowe możliwości konwergencji są na wyciągnięcie ręki.

Wyzwania na drodze do sieci w pełni Ethernet

Chociaż branża generalnie optymistycznie podchodzi do przejścia na Ethernet, nadal trudno jest zapewnić wysoką wydajność sieci i zbudować dojrzałe systemy zarządzania na tej nowej architekturze, co wiąże się z trzema głównymi wyzwaniami.

Utrata pakietów: HPC i wysokiej klasy sieci pamięci masowej są niezwykle wrażliwe na utratę pakietów, a Ethernet jest szczególnie podatny na ten problem.

Wydajność zarządzania: tradycyjnie centra danych są zarządzane oddzielnie przez niezależne narzędzia i platformy mapujące, które stają się mniej efektywne wraz ze wzrostem intensywności i skali centrów danych, co ma negatywny wpływ na obsługę i konserwację sieci (O&M).

Multichmura i multiscenariusz: aby zagwarantować stabilność usług podstawowych i szybko reagować na zmiany w usługach, przedsiębiorstwa wolą wdrażać elastyczne usługi w chmurach publicznych i stabilne usługi w chmurach prywatnych, co prowadzi do rozproszonej infrastruktury centrum danych w różnych chmurach. Ponadto, wraz z nadchodzącą erą cyfrową, scenariusze usług stają się coraz bardziej złożone i różnorodne, co stawia wyższe wymagania dotyczące otwartości sieci i serwityzacji.

CloudFabric 3.0 firmy Huawei umożliwia trójwarstwową konwergencję DCN

Aby sprostać wyzwaniom związanym z przyjęciem sieci Ethernet, Huawei wprowadził na rynek swoje hiperkonwergentne rozwiązanie DCN CloudFabric 3.0, oparte na bogatych w funkcje przełącznikach do centrów danych z serii CloudEngine oraz iMaster Network Cloud Engine (NCE), inteligentnym systemie zarządzania i kontroli sieci. Oparte na trójwarstwowej konwergencji DCN, rozwiązanie maksymalizuje przepływ danych i wydajność obsługi oraz w pełni uwalnia moc obliczeniową centrów danych, oferując szereg kluczowych korzyści.

Bezstratna architektura Ethernet: ujednolica trzy silosowe architektury sieciowe i łączy transmisję zróżnicowanego ruchu na nich.

Zautomatyzowane zarządzanie przez cały cykl życia: łączy zarządzanie siecią, kontrolę i analizę oraz integruje dane z szerokiej gamy platform i narzędzi zarządzania.

Sieć jako usługa we wszystkich scenariuszach (NaaS): łączy wiele scenariuszy usług i centralizuje moc obliczeniową w różnych regionach i scenariuszach.

Bezstratny Ethernet dla HPC: uwolnienie 100% mocy obliczeniowej

W tradycyjnych scenariuszach sieci Ethernet wskaźnik utraty pakietów wynoszący zaledwie 0,1% może zmniejszyć moc obliczeniową o zdumiewające 50%. W związku z tym w ciągu ostatnich czterech dekad dostawcy na całym świecie zaproponowali wiele podejść do wyeliminowania utraty pakietów Ethernet. Jeden z nich – kontrola przepływu i podejście przeciwciśnienia – służy do kontrolowania szybkości transmisji pakietów. Jednak takie podejście często zawiesza transmisję pakietów, co prowadzi do bardzo niskiej przepustowości.

Co więcej, w miarę jak ruch aplikacji sieciowych stale rośnie pod względem różnorodności i złożoności, kontrolowanie szybkości transmisji pakietów staje się mniej praktyczne. Właśnie tam wkracza innowacyjny algorytm iLossless-DCN firmy Huawei, wdrażając precyzyjną kontrolę prędkości w czasie rzeczywistym, eliminując utratę pakietów i podwajając moc obliczeniową bez zwiększania skali sieci.

Bezstratny Ethernet dla pamięci masowej: poprawa wydajności o 87%

Spośród wszystkich scenariuszy usług centra danych finansowych typu „aktywny-aktywny” mają najbardziej rygorystyczne wymagania dotyczące wydajności sieci pamięci masowej. W mieście centra danych mogą być oddalone od siebie o 30–70 km. Przesyłanie danych przez światłowody na takie odległości często skutkuje opóźnieniem statycznym wynoszącym około 5 μs/km, które zwiększa się tylko wraz ze wzrostem odległości. Z tego powodu opóźnienie transmisji na duże odległości jest 100 razy większe niż w przypadku transmisji na krótkie odległości, co znacznie zwiększa złożoność sterowania przepływem.

Aby rozwiązać ten problem, Huawei dodał zmienne odległości do swojego algorytmu bezstratnej transmisji na krótkie odległości i stworzył algorytm iLossless-DCI, dokładnie dla scenariuszy transmisji na duże odległości. Ten algorytm przewiduje i radzi sobie ze zmianami ruchu w oparciu o analizę big data, osiągając bezstratną transmisję danych podróżującą do 70 km z prędkością 100 Gb/s. Ponadto sieci pamięci masowej zbudowane na rozwiązaniu CloudFabric 3.0 Huawei wymagają o 90% mniej łączy, poprawiają liczbę operacji wejścia/wyjścia na sekundę (IOPS) o 87% i zmniejszają opóźnienia sieci o 42% w porównaniu z sieciami FC.

Automatyzacja pełnego cyklu życia, wdrażanie usług w kilka sekund i inteligentna obsługa i konserwacja „1-3-5”

W większości współczesnych sieci DCN konfiguracje mogą być rzeczywiście dostarczane automatycznie, ale projektowanie i weryfikacja sieci nadal w dużym stopniu opierają się na operacjach ręcznych. Huawei na nowo definiuje ten trend, wprowadzając koncepcję cyfrowego bliźniaka do zarządzania siecią, umożliwiając automatyzację sieci w pełnym cyklu życia. Stosując cyfrowe modelowanie sieci, rozwiązanie CloudFabric 3.0 Huawei kompleksowo ocenia ponad 400 czynników projektowych sieci, na podstawie wyników zaleca optymalne rozwiązania projektowe sieci, a następnie weryfikuje zmiany konfiguracji w ciągu kilku sekund.

W szczególności rozwiązanie zapewnia wykres wiedzy o sieci, aby uzyskać inteligentne O&M „1-3-5”: awarie są wykrywane w ciągu 1 minuty, lokalizowane w ciągu 3 minut i naprawiane w ciągu 5. Ponadto, dzięki eksploracji i modelowaniu Big Data, rozwiązanie CloudFabric 3.0 Huawei wykrywa korelacje między obiektami sieciowymi i regułami rozprzestrzeniania się błędów, aby dokładnie wykryć 90% potencjalnych błędów.

Wszechstronne NaaS: skrócenie czasu wdrażania usług w różnych chmurach z miesięcy do zaledwie dni

Sieci heterogeniczne są powszechnie używane w scenariuszach z wieloma chmurami, a do zarządzania urządzeniami różnych dostawców należy wdrożyć wiele zestawów kontrolerów. W takich scenariuszach zmiana usługi nie może być dokonana za pomocą tylko jednego kontrolera. Jeśli kontrolery nie są w stanie obsłużyć zmian usług, dostawcy urządzeń muszą wkroczyć i zaktualizować kontrolery, co zajmuje średnio od trzech do sześciu miesięcy. Co gorsza, te kontrolery muszą być również połączone z platformami zarządzania chmurą, co skutkuje złożonymi obciążeniami adaptacyjnymi.

Aby rozwiązać ten problem, rozwiązanie CloudFabric 3.0 firmy Huawei definiuje ujednolicony model elementów sieci i buduje otwartą strukturę southbound, aby centralnie zarządzać urządzeniami wielu dostawców i dynamicznie ładować sterowniki urządzeń. Ponadto rozwiązanie zapewnia tysiące sieciowych usług interfejsu programowania aplikacji (API) northbound, umożliwiając elastyczną orkiestrację sieci na platformie zarządzania chmurą i skracając czas wdrażania usługi z kilku miesięcy do zaledwie tygodnia.

CloudFabric 3.0: uwolnienie mocy obliczeniowej dzięki wykorzystaniu technologii w pełni Ethernet

Centra danych integrują rozległe zasoby oprogramowania i sprzętu, od chipów, serwerów, urządzeń pamięci masowej i obiektów sieciowych po platformę i oprogramowanie aplikacyjne. Aby zapewnić wysoką moc obliczeniową, zasoby te muszą być wysoce skoordynowane i zbieżne. Jako lider w konwergencji DCN, hiperkonwergentne rozwiązanie DCN CloudFabric 3.0 Huawei przeprowadza możliwości bezstratnej sieci Ethernet i autonomicznej sieci jazdy (ADN) CloudFabric 2.0 do ery w pełni Ethernet. Rozwiązanie to, oparte na trójwarstwowej architekturze konwergentnej, znacznie poprawia wydajność przepływu i obsługi danych, uwalnia 100% mocy obliczeniowej i stanowi solidną podstawę dla gospodarki cyfrowej i cyfrowej transformacji przedsiębiorstwa.

Zastrzeżenie: Poglądy i opinie wyrażone w tym artykule są poglądami autora i niekoniecznie odzwierciedlają oficjalną politykę, stanowisko, produkty i technologie Huawei Technologies Co., Ltd. Aby dowiedzieć się więcej o produktach i technologiach Huawei Technologies Co., Ltd., prosimy odwiedzić stronę internetową e.huawei.com lub o kontant z nami.

TOP