Qué es la lista Top500 de las supercomputadoras

0

 ¿Qué es el Top500?

Este proyecto surge para clasificar las 500 supercomputadoras más potentes del mundo, de ahí su nombre Top500. La primera vez que se hizo fue en 1993, y desde entonces publica una lista actualizada dos veces al año. La primera se realiza en junio y la segunda en noviembre. No son fechas elegidas por casualidad, ya que la de junio se presenta en la International Supercomputing Conference y la de noviembre se hace en la ACM/IEEE Supercomputing Conference.

Cualquier persona interesada en conocer estas listas y todos los detalles, puede acceder de forma gratuita desde su portal oficial top500.org. Además, debes saber que este proyecto no solo sirve para que los países saquen músculo y presuman de poder computacional, también es una forma de rastrear y hacer un seguimiento de las tendencias de HPC.

En cuanto a la confesión de las listas, las realizan un grupo de expertos y se basa en las clasificaciones HPL, es decir, una implementación portable del banco de pruebas LINPACK de alto rendimiento. Este benchmark está escrito en lenguaje de programación Fortran y se puede ejecutar en sistemas de memoria distribuida.

Aunque la lista se realiza en multitud de países de todo el mundo, el líder indiscutible en supercomputadoras instaladas era Estados Unidos, que cuenta con casi el 50% del total de las 500 máquinas analizadas por el momento. En segunda posición estaba China, que actualmente se ha puesto líder, siendo el primer país en la historia que supera a EE.UU. Mientras que otros países se reparten el resto. Dentro de Europa, Alemania es el país mejor posicionado, en tercer lugar, con más de 30 supercomputadoras, seguido muy de cerca por Japón. Y si te preguntas por España, el más potente de los que tenemos aquí y el único que entra en la lista Top500 es el Marenostrum instalado en el BSC de Barcelona.

No obstante, en España existe la RES (Red Española de Supercomputación), y que se compone por varios supercomputadores repartidos por toda la geografía española e interconectados entre sí:

  • Barcelona Supercomputing Center (BSC) – Centro Nacional de Supercomputación (CNS) en Barcelona. Al ser el más potente, actúa como coordinador de los demás.
  • BIFI de la Universidad de Zaragoza.
  • PICASSO de la Universidad de Málaga.
  • NASERTIC de Navarra.
  • CETA del CIEMAT (Centro de Investigaciones Energéticas, Medioambientales y Tecnológicas) en Madrid.
  • Altamira de la Universidad de Cantabria.
  • Tirant de la Universidad de Valencia.
  • Universidad Autónoma de Madrid.
  • Instituto de Astrofísica de Canarias.
  • FinisTerrae del Centro de Supercomputación de Galicia.
  • Centro de Supercomputación de Castilla y León.
  • Centro de Supercomputación de Extremadura.
  • Consorcio de Servicios Universitarios de Catalunya.
  • Port d’Informació Científica PIC.

País o territorioSistemas
China162
Estados Unidos127
Alemania34
Japón31
Francia24
Reino Unido15
Canadá10
Corea del Sur8
Brasil8
Países Bajos8
Italia7
Rusia7
Arabia Saudí6
Suecia6
Australia5
Irlanda5
Suiza4
Singapur3
Noruega3
India3
Finlandia3
Polonia3
Taiwán2
República Checa2
Luxemburgo2
Emiratos Árabes Unidos2
Austria2
Eslovenia2
España1

Por último, decir que entre los expertos actuales que intervienen en la compilación de esta lista Top500 tenemos a Jack Dongarra de la Universidad de Tennessee, Erich Strohmaier y Horst Simon del NERSC (National Energy Research Scientific Computing Center) y del Lawrence Berkeley National Laboratory (LBNL), y hasta 2014 también participaba Hans Meuer de la Universidad de Mannheim en Alemania.

Un poco de historia

Debido al rápido crecimiento de la supercomputación, se hizo necesario llevar un seguimiento de las capacidades de este sector con fines informativos. Además, a principios de los años 90 se necesitaba una nueva definición de qué era una supercomputadora. Y después de usar varias métricas que no resultaron ser apropiadas hasta 1992, en la Universidad de Mannheim surgió la idea de usar el recuento de procesadores instalados.

A principios de 1993 convencieron a Jack Dongarra para que se uniera al proyecto de los puntos de referencia de LINPACK y entonces se produjo la primera prueba para confeccionar la lista. Consultando diversas fuentes, se publicaron dos primeras listas y surgiendo así el sitio Top500 tal como lo conocemos actualmente.

Desde esta fecha, el número 1 del ranking del Top500 siempre ha estado ocupado por un sistema que seguía la famosa ley de Moore, duplicando la cantidad de transistores cada 14 meses aproximadamente. Y, aunque la mayoría de estas supercomputadoras estaban basadas en procesadores x86 como los Intel Xeon y AMD Opteron/EPYC, así como los IBM POWER, lo cierto es que últimamente también hemos visto sorpresas con otras CPUs más exóticas, como es el caso de la Fugaku japonesa, con chips Fujitsu A64FX basados en ARM.

Además, últimamente se han agregado los sistemas basados en computación heterogénea, por lo que también se usa la potencia de cómputo de otras unidades usadas como aceleradores, como pueden ser las GPUs.

Datos interesantes de la Top500

Para apreciar mejor la evolución que han tenido los microprocesadores usados en HPC a lo largo de los años en esta lista Top500, se puede ver este gráfico:

Como se puede apreciar, en las actuales supercomputadoras de la lista Top500, Intel es el líder indiscutible, seguido de AMD y los IBM POWER. Poco a poco estos han ido estrangulando al resto de diversidad de procesadores que hubo en el pasado, donde todo estaba más repartido. No obstante, poco a poco también vemos que aparecen chips Fujitsu A64FX, Cavium y ThunderX basados en ARM, entre otras arquitecturas.

Por otro lado, también se puede hacer el mismo análisis con los sistemas operativos, y en este caso hay un claro dominante: Linux. Y es que el sistema operativo de código abierto está actualmente potenciando al 100% de las supercomputadoras de la lista Top500:


Poco a poco otros Unix han ido dejando paso a Linux, que ha acabado con todos. Dentro de los Unix ha habido diversos sistemas operativos, como los HP-UX, IBM AIX, Solaris, etc. Y dentro de Linux también existen diversas distribuciones como:

Sistema operativoSistemas
Linux (otros, como SUSE Linux Enterprise Server o SLES, Ubuntu Server,…)264
CentOS89
Cray Linux Environment (ahora propiedad de HPE)31
bullx SCS12
Red Hat Enterprise Linux (RHEL)12
Otros datos curiosos es saber que los aceleradores más empleados en estos supercomputadores de la lista Top500 son:

AceleradorSistemas
NVIDIA TESLA V100 (lanzado: 2017)80
NVIDIA AMPERE A100 (lanzado: 2020)15
NVIDIA TESLA V100 SXM2 (lanzado: 2017)12
NVIDIA TESLA P100 (lanzado: 2016)8
NVIDIA AMPERE A100 SXM4 40 GB (lanzado: 2020)5
Como se puede apreciar, NVIDIA es el líder absoluto en este tipo de sistemas para HPC.

Por otro lado, si nos centramos en los constructores o proveedores de supercomputadoras, nos encontramos que los líderes son:

FabricanteSistemas
Lenovo (China)184
Inspur (China)58
Sugon (China)45
HPE o Hewlett Packard Enterprise (EE.UU.)39
Atos (Europa)36
Como vemos, el fabricante Lenovo es uno de los principales. No obstante, aunque no se incluyan en esta tabla, también existen otros como IBM, Dell EMC, Fujitsu, NEC, MEGWARE, etc.

Ejemplo Top10 actual

Por ejemplo, para que te hagas una idea, aquí tienes una tabla con el Top10 de la Top500 actual:

RECUENTO DE NÚCLEOS DEL ACELERADORINTERCONEXIÓN DE RED
FABRICANTEPAÍS Y SITIOAÑOSISTEMA OPERATIVO1

1.102,00
1.685,65

FrontierHPE Cray EX235a591.872

(9.248 × EPYC 3ª Gen de
64 núcleos a 2,0 GHz)

36.992 × 220 AMD Instinct MI250XSlingshot-11

HPE

Laboratorio Nacional de Oak Ridge –  Estados Unidos2022HPE Cray y SUSE2

442.010
537.212

FugakuFugaku7.630.848

(158.976 × Fujitsu A64FX
de 48 núcleos a 2,2 GHz)

No usaInterconexión de Tofu D

Fujitsu

Centro RIKEN de Ciencias Computacionales –  Japón2020RHEL3

309,10
428,70

LUMIHPE Cray EX235a150.528

(2352 × EPYC 3ª Gen
con 64 núcleos a 2,0 GHz)

9.408 × 220 AMD Instinct MI250XSlingshot-11

HPE

EuroHPC JU – Unión Europea, Kajaani, Finlandia2022HPE Cray y SUSE4

174,70
255,75

LeonardoToroSequana XH2000110.592

(3456 × Xeon Platinum 8358
de 32 núcleos a 2,6 GHz)

13.824 × 108 Nvidia Ampere A100Nvidia HDR100 Infiniband

Atos

EuroHPC JU – Unión Europea, Bolonia, Italia2022Linux5

148.600
200.795

SummitIBM Power System
AC922202.752

(9.216 × IBM POWER9
de 22 núcleos a 3,07 GHz)

27.648 × 80 Nvidia Tesla V100InfiniBand EDR

IBM

Laboratorio Nacional de Oak Ridge – Estados Unidos2018RHEL6

94.640
125.712

SierraIBM Power SYstem
S922LC190.080

(8.640 × IBM POWER9
de 22 núcleos a 3,1 GHz)

17.280 × 80 Nvidia Tesla V100InfiniBand EDR

IBM

Laboratorio Nacional Lawrence Livermore – Estados Unidos2018RHEL7

93.015
125.436

Sunway
TaihuLuzMPP Sunway10.649.600

(40.960 × 260 núcleos Sunway SW26010 a 1,45 GHz)

No usaSunway

NRCPC

Centro Nacional de Supercomputación en Wuxi – China2016Raise OS8

70,87
93,75

PerlmutterHPE Cray EX235nAMD EPYC 7763 de 64 núcleos a 2,45 GHzNvidia Ampere A100Slingshot-10

HPE

NERSC – Estados Unidos2021HPE Cray9

63.460
79.215

SeleneNVIDIA71.680

(1120 × AMD EPYC 7742 de 64 núcleos a 2,25 GHz)

4480 × 108 Nvidia Ampere A100Mellanox HDR Infiniband

NVIDIA

Nvidia – Estados Unidos2020Ubuntu10

61.445
100.679

Tianhe-2ATH-IVB-FEP427.008

(35.584 × Intel Xeon E5–2692 v2 de
12 núcleos a 2,2 GHz)

35.584 × Matrix-2000 128 núcleosTH expreso-2

NUDT

Centro Nacional de Supercomputadoras en Guangzhou – China2018Kylin
  • Posición: es la posición que ocupa actualmente dentro del ranking Top500 de la lista según la revisión de noviembre de 2022.
  • Rmax/Rpeak: se refieren a la puntuación en LINPACK, es decir, el rendimiento en medido en PFLOPS o PetaFLOPS.  Mientras Rmax es el rendimiento que ha alcanzado en LINPACK, Rpeak es el rendimiento máximo teórico que tendrían este sistema.
  • Nombre: es el nombre del supercomputador.
  • Modelo: se refiere a la plataforma empleada para su creación o quién lo comercializa.
  • Recuento de núcleos de CPU/Recuento de núcleos del acelerador: la cantidad de núcleos de procesamiento de CPU o de otro acelerador que emplea.
  • Interconexión de red:  se refiere al tipo de red que interconecta los nodos instalados. Suelen ser redes de alto rendimiento como InfiniBand, Gigabit Ethernet u otras propietarias. De esta forma, todos esos nodos pueden trabajar como un solo computador.
  • Fabricante: es la empresa encargada de su diseño y montaje.
  • Sitio y País: el lugar donde está instalado el supercomputador.
  • Año: es el año de su instalación.
  • Sistema operativo: el SO o SSOO que emplea para funcionar.
¿Qué es Green500?


Como bien sabes, estas enormes máquinas consumen gran cantidad de energía. Estos centros de procesamiento de datos podrían llegar a varias decenas de megavatios hora, lo que supone un consumo muy elevado y un gasto energético igualmente caro. Y a todo esto hay que agregar la energía necesaria para los sistemas de refrigeración, que también suele estar por varios megavatios.

Por eso, de forma semestral, los miembros de la lista Top500 también muestran un listado con los 500 supercomputadores ordenados según su rendimiento/vatio consumido, es decir, por su nivel de eficiencia. Esto te da una idea de cuáles son los sistemas más eficientes.

La lista Green500 ha estado encabezada por diferentes tipos de equipos, algunos basados en x86, otros en POWER, con o sin aceleradores, etc. Sin embargo, en este caso el ranking sería algo similar a este ejemplo de los 3 supercomputadores más eficientes según la lista Green500 de 2022:

PuestoRendimiento
por vatio
(GFLOPS/vatio)
NombreModelo
Procesadores, GPU, Interconexión
ProveedorSitio,
País, año
Rmax
(PFLOPS)
165.091HenriLenovo ThinkSystem SR670 V2
Intel Xeon Platinum 8362 2,8 GHz (32C), Nvidia H100 80 GB PCIe, InfiniBand HDR,
LenovoInstituto Flatiron
– Estados Unidos, 2022
2.04
262.684Frontier TDS
HPE Cray EX235a
AMD Optimized EPYC 64C de 3.ª generación 2 GHz, AMD Instinct MI250X, Slingshot-11
HPEOE/SC/Laboratorio Nacional de Oak Ridge – Estados Unidos, 202219.20
358.021AdAstraHPE Cray EX235a
AMD Optimized EPYC 64C de 3.ª generación 2 GHz, AMD Instinct MI250X, Slingshot-11
HPEGrand Equipement National de Calcul Intensif – Centre Informatique National de l’Enseignement Superieur (GENCI-CINES),
 – Francia, 2022
46.10
En este otro caso tenemos una columna para la posición ocupada en la Green500, una segunda que muestra la eficiencia contabilizada en GFLOPS/w, luego hay otra columna con el nombre del supercomputador, otra más con las características técnicas, el fabricante, el lugar donde está instalado y fecha, y el rendimiento según Rmax en PFLOPS, para hacerte una idea de dónde estaría posicionado en la lista Top500.

Como se puede comprobar, el número 1 actual del Green500 puede desarrollar un rendimiento por vatio de 65.091 GFLOPS. En cambio, si lo buscamos en la lista Top500, el Henri estará en el puesto número 11 de los más potentes del mundo.

Quizás estés pensando ¿y los ARM? Pues bien, parece que esto es el mundo al revés, ya que mientras Arm siempre ha presumido de rendimiento y eficiencia, y pese a que muchos veían disparatado que un Arm pudiera superar a otros procesadores, lo cierto es que han demostrado que los que creían eso estaban equivocados. El ejemplo está en el Fugaku, que se basa en chips ARM de Fujitsu y ahora se sitúa en la posición 2 del Top500, aunque no hace mucho llegó a ocupar la posición 1. Sin embargo, cuando analizamos la lista Green500, pensarías que está de los primeros…

En realidad del Fugaku está en la posición 43, con 15.418 GFLOPS/w. ¿Entonces? ¿Te han engañado? ¿Los ARM no son tan eficientes? Bueno, si lo comparamos con el Frontier que ocupa la posición 1 del Top500 en la actualidad, vemos que ocupa una posición mucho mejor en el ranking Green500, con un sexto puesto. Y eso que está basado en AMD EPYC y aceleradores AMD Instinct MI250X. Y no solo eso, tiene más núcleos, con un total de 8.730.112 frente a los 7.630.848 del Fugaku.

Como se puede apreciar en esta comparativa, no siempre ARM es el más eficiente. Aquí tienes la prueba. Además, que gracias a los aceleradores se pueden conseguir grandes ventajas de rendimiento por vatio consumido como ya expliqué aquí. Y, como se puede comprobar en la lista Top500, el Fugaku usa solo la potencia de sus procesadores Fujitsu A64FX, y carece de aceleradores…

En definitiva, la ISA no siempre es lo más importante cuando se trata de rendimiento y consumo, sino la microarquitectura, es decir, la forma en la que se implementa esa ISA. Y, como nos ha dado una lección esta lista Green500, la computación heterogénea es una gran ventaja.

¿Qué es Graph500?


Para finalizar, existe otra lista o clasificación de sistemas HPC, pero en este caso no está orientada al rendimiento de cálculo como la Top500 ni a la eficiencia energética como Green500, sino que etá orientada a posicionar las supercomputadoras según las cargas de datos intensivas. T esta lista se denomina Graph500.

La Graph500 se publicó por primera ve en 2010 en la ACM/IEEE Supercomputing Conference. Esta lista también se basa en una actualización de dos veces por año, como la Top500, en junio y en noviembre, coincidiendo con la otra.

En cambio, en vez de usar en este caso el benchmark LINPACK, en este Graph500 se emplean métricas de rendimiento basadas en GTEPS (GigaTEPS), siendo TEPS las siglas de Traversed Edges Per Second. Se trata de una medida de capacidad de comunicación, y contrasta con los FLOPS (Floating Point Per Second) que son de puro rendimiento de cálculo en coma flotante de precisión doble (64-bit), o FP64, y no tiene en cuenta las capacidades de comunicación de la máquina.

Evidentemente, no siempre se necesita en un centro de procesamiento que destaquen los GTEPS si no se va a usar la supercomputadora para fines como el Big Data, ya que, por ejemplo, las simulaciones de CFD o las aplicaciones científicas suelen necesitar rendimiento de FLOPS.

Gracias a Graph500, se pueden catalogar las supercomputadoras más potentes del mundo según estos términos y así poder analizar los problemas relacionados con los datos complejos. Y es que estos sistemas necesitan un énfasis en los sistemas de comunicación.Para medir este rendimiento en GTEPS se usan varios programas como benchmarks, como puede ser GNU Octave, versiones de programas en C haciendo uso de OpenMP, MPI, etc.

Para hacerte una idea de esta lista, te muestro la siguiente tabla actualizada en noviembre de 2022, con los 3 primeros en la Graph500:
Tags

Publicar un comentario

0 Comentarios
* Por favor, no envíe spam aquí. Todos los comentarios son revisados ​​por el administrador.
Publicar un comentario (0)

#buttons=(Accept !) #days=(20)

Our website uses cookies to enhance your experience. Learn More
Accept !
Subir