Jeśli powiedziano ci kilka lat temu, że superkomputer oparty na chipach ISA ARM zamierzali zająć pierwsze miejsce w TOP500 (lista 500 najpotężniejszych superkomputerów na świecie) śmiech byłby głośny. Nikt nie przypuszczał, że dotrze tam architektura, która praktycznie nie była używana.
Stopniowo układy ARM zyskują na popularności, podbijając teren urządzeń mobilnych ze względu na ich wydajność i wydajność, a także wiele innych produktów wbudowanych. Ale kilka lat temu zaczęli tworzyć niektóre serwery z ARM niskie zużycie i zaczął flirtować z tym ISA w sektorze HPC (High Performance Computing).
Wiadomości, które ostatnio pojawiły się na ten temat Apple rezygnuje z Intela Stworzenie własnych chipów opartych na ARM było ważne, mimo wszystko, co się z tym wiąże, ale przeszło prawie niezauważone przez inne, znacznie ważniejsze wiadomości. I to właśnie superkomputer ARM mógłby pobić wydajność IBM Summit i zająć pierwsze miejsce na liście Top500. Po raz pierwszy ARM sięga tak wysoko, a to oznaczało przed i po ...
Wracając do Apple, wydawało się dziwne, że układ ARM może przewyższyć Intel pod względem wydajności i wydajności, ale Apple to zaproponował i będzie w stanie stworzyć bardzo ciekawe projekty. Intel staje się coraz bardziej skomplikowany, i to nie tylko ze względu na konkurencję ze strony AMD ...
Superkomputer
Ale to, czego nigdy byś sobie nie wyobraził, dawno temu, to właśnie to można również koronować na HPC. Chcesz poznać więcej szczegółów? Cóż, na liście Top500 na czerwiec 2020 r. Pierwsze miejsce zajmuje japoński superkomputer Fugaku. Superkomputer oparty na układach 64Ghz Fujitsu A48FX 2.2C, z których 7.299.072 rdzenie obliczeniowe dodaje bestii wydajności obliczeń zmiennoprzecinkowych.
konkretnie osiąga 415,5 PFLOPS (czyli 415.500.000.000.000.000 obliczeń z liczbami dziesiętnymi na sekundę) i zostaną wykorzystane między innymi do badań nad SARS-CoV-2.
Jest zainstalowany w RIKEN Computing Center w Kobe w Japonii. W tym centrum danych ich więcej niż 150 tys. Węzłów z których się składa, połączonych ze sobą za pośrednictwem szybkiej sieci Tofu Interconect D w celu połączenia układów ARMv8.2-A SVE o 52 rdzeniach na węzeł.
Użyj również pamięci HBM2 o dużej przepustowości i przepustowości 32 GiB na węzeł. Jeśli chodzi o pamięć masową, ma 1.6 TB NVMe współużytkowanego na 16 węzłów, a także 150 PB Shared FS i dodatkową usługę przechowywania w chmurze.
Jako system operacyjny użyj linuxa, w szczególności dystrybucja RHEL 8, a także IHK / McKernel jednocześnie. Wszystkie symulacje wydajności zostały zmierzone pod McKernelem, chociaż Linux dostarcza resztę usług POSIX.
Chip
Bestia przetwarzająca, która przedstawiła te liczby, jest dość „pokorna”. To chip stworzony przez Fujitsu. Nazywa się A64FX i jest to mikroprocesor oparty na architekturze ARM 8.2A, również przyjmujący SVE (Scalable Vector Extensions), dodatkowe rozszerzenia do tego podstawowego ISA w celu uzyskania lepszych wyników obliczeń.
A64FX, który ma Zaprojektowane przez Fujitsu w ten sposób zastępuje swoje poprzednie chipy HPC oparte na SPARC. I nie tylko wyznaczyli kamień milowy w wyniesieniu Fugaku na szczyt Top500, ale także jako pierwsi obsługujący 512-bitowy SIMD EVS.
Te chipy zostały wyprodukowane w Fabryki TSMC, to samo, gdzie produkują Zen AMD, i to samo, gdzie będą produkować przyszły chip w Europie. Technologia, w której wykorzystali technologię 7 nm do zbudowania 8.786.000.000 594 XNUMX XNUMX tranzystorów. Wszystko to w małym chipie, który potrzebuje tylko XNUMX pinów.
Ponadto każdy procesor wykorzystuje 32 GB pamięci HBM2 z rozszerzeniem Przepustowość 1 TB / s, z 16 liniami lub liniami PCIx na procesor, aby połączyć je z akceleratorami, takimi jak GPGPU i FPGA.
Wreszcie, działa z częstotliwością 2.2 GHz i dodano wystarczającą liczbę pakietów, aby uzupełnić tę liczbę prawie 7.3 miliona rdzeni i prawie 5 PB pamięci.
Osiągnięty poziom przetwarzania i przyszłe praktyczne zastosowania, które będą z tym wiązać, są niewiarygodne. W tej chwili, kiedy umieszczam ten komentarz na Twojej wspaniałej stronie, chip, którego używa mój komputer stacjonarny, to Intel. Ten komputer ma 8 lat, ale nadal mam nadzieję, że wytrzyma co najmniej 2 lata więcej, więcej niż wystarczająco dużo czasu, aby wszystkie te postępy w dziedzinie superkomputerów zostały przeniesione nie tylko do firm, ale także do środowiska domowego.
Mam 61 lat i kiedy procesory RISC zaczęły mieć problemy, ponieważ były produkowane przez stosunkowo małe firmy i mało marketingowe; Zawsze mówił, że pewnego dnia jego szczęście może się zmienić i to może być jego wielka szansa
Będę musiał dać Rasperry Pi, aby był w dobrym stylu z ARM.
Imponująca maszyna, miejmy nadzieję, że użycie w modelowaniu Covida w tym superkomputerze przyniesie rezultaty.
Jeśli to możliwe, chciałbym porównać moc tego procesora z reklamami. Nawet jeśli pochodzi z dzielenia petaflopsów. Powyżej 500 Gbflops są Ryzen 3600 lub i510600. 415,5 PFLOPS / 150 tys. Węzłów ~ = 415.500.000.000.000 150 2.770.000.000.000 2.770 XNUMX/XNUMX = XNUMX XNUMX XNUMX XNUMX => XNUMX gigaflopów na węzeł.
415.500.000.000.000 / 150
Oznacza to więcej niż 5 obecnie najlepiej sprzedających się konsumenckich procesorów X86.
Co oznacza, że komputery osobiste ARM mogą być oferowane z GNU - lub Chromebookami - mocniejszymi - i prawdopodobnie tańszymi - niż alternatywy dla X86.
Gdybym pracował w Valve, już tworzyłbym wersję Steam na ramię - chromebooki już istnieją - zastanawiałbym się nawet, czy mógłbym zrobić dobrą, ładną i tanią Steam Machine z tym procesorem lub nieco tańszą wersją.
GIGA 9 / TERA 12 / PETA 15 (zera)
W tamtych czasach AMD „wpędziło Intel w poważne kłopoty”. Wydawało się, że Transmeta i jego Crusoe również sprawiają Intelowi „poważne kłopoty”. A nie tak dawno temu PowerPC były cytrynową gruszką, a Intel miał zniknąć (dyskurs Maquero, który zmienił się tak, jakby nigdy nie istniał, gdy Apple przeszedł na Pentium).
Wydaje się, że wszyscy zapominają, że:
1. Firma Intel ma najlepsze na świecie podstawy półprzewodników.
2. Intel może sobie pozwolić na najlepszych inżynierów na świecie.
3. Intel ma licencje ARM w szufladzie. Każdego dnia, gdy masz na to ochotę, możesz spakować pakiet, aby uzyskać jeszcze wyższą jakość ARM niż ta, która jest obecnie produkowana, i zdobyć dużo pieniędzy. A jeśli będziesz tego potrzebować, kupisz niezbędne licencje.
Więc nie, przez jakiś czas będziemy mieć Intel.
Poprawny. Moje serduszko jest niebieskie ... Głosuję na Intela.