Jeśli powiedziano ci kilka lat temu, że superkomputer oparty na chipach ISA ARM zamierzali zająć pierwsze miejsce w TOP500 (lista 500 najpotężniejszych superkomputerów na świecie) śmiech byłby głośny. Nikt nie przypuszczał, że dotrze tam architektura, która praktycznie nie była używana.
Stopniowo układy ARM zyskują na popularności, podbijając teren urządzeń mobilnych ze względu na ich wydajność i wydajność, a także wiele innych produktów wbudowanych. Ale kilka lat temu zaczęli tworzyć niektóre serwery z ARM niskie zużycie i zaczął flirtować z tym ISA w sektorze HPC (High Performance Computing).
Wiadomości, które ostatnio pojawiły się na ten temat Apple rezygnuje z Intela Stworzenie własnych chipów opartych na ARM było ważne, mimo wszystko, co się z tym wiąże, ale przeszło prawie niezauważone przez inne, znacznie ważniejsze wiadomości. I to właśnie superkomputer ARM mógłby pobić wydajność IBM Summit i zająć pierwsze miejsce na liście Top500. Po raz pierwszy ARM sięga tak wysoko, a to oznaczało przed i po ...
Wracając do Apple, wydawało się dziwne, że układ ARM może przewyższyć Intel pod względem wydajności i wydajności, ale Apple to zaproponował i będzie w stanie stworzyć bardzo ciekawe projekty. Intel staje się coraz bardziej skomplikowany, i to nie tylko ze względu na konkurencję ze strony AMD ...
Superkomputer

Ale to, czego nigdy byś sobie nie wyobraził, dawno temu, to właśnie to można również koronować na HPC. Chcesz poznać więcej szczegółów? Cóż, na liście Top500 na czerwiec 2020 r. Pierwsze miejsce zajmuje japoński superkomputer Fugaku. Superkomputer oparty na układach 64Ghz Fujitsu A48FX 2.2C, z których 7.299.072 rdzenie obliczeniowe dodaje bestii wydajności obliczeń zmiennoprzecinkowych.
konkretnie osiąga 415,5 PFLOPS (czyli 415.500.000.000.000.000 obliczeń z liczbami dziesiętnymi na sekundę) i zostaną wykorzystane między innymi do badań nad SARS-CoV-2.
Jest zainstalowany w RIKEN Computing Center w Kobe w Japonii. W tym centrum danych ich więcej niż 150 tys. Węzłów z których się składa, połączonych ze sobą za pośrednictwem szybkiej sieci Tofu Interconect D w celu połączenia układów ARMv8.2-A SVE o 52 rdzeniach na węzeł.
Użyj również pamięci HBM2 o dużej przepustowości i przepustowości 32 GiB na węzeł. Jeśli chodzi o pamięć masową, ma 1.6 TB NVMe współużytkowanego na 16 węzłów, a także 150 PB Shared FS i dodatkową usługę przechowywania w chmurze.
Jako system operacyjny użyj linuxa, w szczególności dystrybucja RHEL 8, a także IHK / McKernel jednocześnie. Wszystkie symulacje wydajności zostały zmierzone pod McKernelem, chociaż Linux dostarcza resztę usług POSIX.
Chip

Bestia przetwarzająca, która przedstawiła te liczby, jest dość „pokorna”. To chip stworzony przez Fujitsu. Nazywa się A64FX i jest to mikroprocesor oparty na architekturze ARM 8.2A, również przyjmujący SVE (Scalable Vector Extensions), dodatkowe rozszerzenia do tego podstawowego ISA w celu uzyskania lepszych wyników obliczeń.
A64FX, który ma Zaprojektowane przez Fujitsu w ten sposób zastępuje swoje poprzednie chipy HPC oparte na SPARC. I nie tylko wyznaczyli kamień milowy w wyniesieniu Fugaku na szczyt Top500, ale także jako pierwsi obsługujący 512-bitowy SIMD EVS.
Te chipy zostały wyprodukowane w Fabryki TSMC, to samo, gdzie produkują Zen AMD, i to samo, gdzie będą produkować przyszły chip w Europie. Technologia, w której wykorzystali technologię 7 nm do zbudowania 8.786.000.000 594 XNUMX XNUMX tranzystorów. Wszystko to w małym chipie, który potrzebuje tylko XNUMX pinów.
Ponadto każdy procesor wykorzystuje 32 GB pamięci HBM2 z rozszerzeniem Przepustowość 1 TB / s, z 16 liniami lub liniami PCIx na procesor, aby połączyć je z akceleratorami, takimi jak GPGPU i FPGA.
Wreszcie, działa z częstotliwością 2.2 GHz i dodano wystarczającą liczbę pakietów, aby uzupełnić tę liczbę prawie 7.3 miliona rdzeni i prawie 5 PB pamięci.