Search

  • Overview
  • Prodotti
  • Video correlati
  • News e eventi
  • Risorse

Data Center Network StarryLink Optical Module

Con l'impennata nello sviluppo dell'IA, i cluster di addestramento dell'IA si sono evoluti fino a raggiungere una scala di oltre 10.000 GPU, con un conseguente aumento significativo del numero di moduli ottici necessari. Ad esempio, il cluster da 1000 GPU necessario per l'addestramento di GPT-3 richiede interconnessioni che utilizzano 2500 moduli ottici da 200G o 4000 moduli ottici da 400G. Per addestrare GPT-4, un cluster da 10.000 GPU richiede interconnessioni con 25.000 moduli ottici da 200G o 40.000 moduli ottici da 400G. Ogni volta che viene aggiunta una GPU, il numero di moduli ottici aumenta in media da 2,5 a 4. Un'interconnessione di rete efficiente è fondamentale per migliorare la potenza di calcolo del cluster di sistema.

Tuttavia, durante il processo di addestramento effettivo, è stato osservato che il tasso di guasto dei moduli ottici è superiore al previsto, con un impatto negativo sull'affidabilità della rete. Il tasso di guasto annuale dei moduli ottici è del 4‰, il che comporta un'interruzione media dell'addestramento per un cluster da 10.000 GPU una volta ogni 3,6 giorni. Il tempo medio di ripristino dei guasti è di 2 ore, con un conseguente spreco giornaliero di 1,4 milioni di CNY in investimenti di potenza di calcolo.

StarryLink Optical Module di Huawei offrono ai clienti esperienze di interconnessione di rete per data center ultra affidabili, a lunga distanza e altamente sicure. La tecnologia di posizionamento della perdita di ritorno ottico a breve distanza consente l'identificazione precisa ed efficiente dei moduli ottici contaminati o allentati, ottenendo una localizzazione dei guasti a livello di minuti. Inoltre, la tecnologia di resistenza alla perdita del canale del modulo ottico migliora l'affidabilità dei moduli ottici di un fattore dieci.

Spanning

Spanning

• Esclusivo algoritmo di accoppiamento del percorso ottico.
• Distanza di trasmissione doppia.

Stabile

Stabile

• Tecnologia esclusiva di posizionamento della perdita ottica di ritorno a breve distanza e resistenza alla perdita di canale.
• Affidabilità 10 volte superiore

Sicuro

Sicuro

• PHYSEC esclusivo per la crittografia al 100% di tutti i pacchetti.
• 0 perdite di dati.

Video Correlati

Video introduttivo su StarryLink Optical Module

Cos'è il posizionamento ottico a breve distanza con perdita di ritorno - Video tecnologico

TOP