Diciembre 06, 2022
El 2022 es un año para la historia de las GPU. Tras años de dominio de NVIDIA y con intentos de AMD por competir al mismo nivel, Intel cumplió su promesa de volver a entrar en el mercado de las tarjetas gráficas. Ahora tenemos a NVIDIA, AMD e Intel compitiendo por un pastel que es muy grande.
Si recopilamos lo sucedido hasta ahora este 2022, tenemos a NVIDIA con su serie RTX 4000 que tan caras y potentes son; tenemos a AMD con su tarjeta gráfica RX 7000 que deben hacer su aparición este mes; y luego nos queda Intel, quien ha lanzado las Intel Arc como propuesta de gama media.
Una vez visto esto, pongamos sobre la mesa a todos los fabricantes y profundicemos en sus arquitecturas, quitando las capas de marketing para ver qué hay de nuevo en las tarjetas gráficas, qué tienen en común y qué significa todo esto para el usuario medio.
En este artículo encontrarás lo más importante de cada compañía, lo que te permitirá diferenciar entre cada marca, su arquitectura y el chip que lo hace posible. Sin más dilación, entramos en materia que hay mucha tarjeta gráfica que cortar:
AMD y RDNA 3: el chip Navi 31
Navi 31 es el mayor chip jamás creado bajo la arquitectura RDNA 3 hasta ahora. En comparación con el Navi 21, el nuevo SoC promete competir de tú a tú con NVIDIA y sus RTX 4000.
Los motores de sombreado (SE) albergan menos unidades de cálculo (CU), 16 frente a 200, pero ahora hay 6 SE en total, dos más que antes. Esto significa que Navi 31 tiene hasta 96 CUs, con un total de 6.144 Stream Processors (SP) de la Radeon 7900 XTX.
Cada motor de sombreado contiene también una unidad dedicada a la rasterización, un motor de primitivas para la configuración de triángulos, 32 unidades de salida de renderizado (ROP) y dos cachés L1 de 256 KB.
AMD tampoco ha cambiado mucho los motores de rasterización y primitivas: las mejoras declaradas del 50 % son para el chip completo, ya que tiene un 50 % más de shaders que el chip Navi 21.
El cambio más obvio es el que más rumores y cotilleos suscitó antes del lanzamiento en noviembre: el enfoque de chiplet para el paquete de la GPU. Con varios años de experiencia en este campo, es lógico que AMD haya optado por esto, pero es enteramente por razones de coste/fabricación, más que de rendimiento.
En Navi 31, los controladores de memoria y sus particiones asociadas de la caché de nivel final se alojan en chiplets separados (llamados MCD o Memory Cache Dies) que rodean al procesador primario (GCD, Graphics Compute Die).
Con un mayor número de SEs que alimentar, AMD también ha aumentado el número de MC en un 50 %, por lo que el ancho total del bus a la memoria global GDDR6 es ahora de 384 bits. Esta vez hay menos Infinity Cache en total (96 MB frente a 128 MB), pero el mayor ancho de banda lo compensa.
Intel y su chip ACM-G10
Pasamos a Intel y a la matriz ACM-G10 (antes llamada DG2-512). Aunque no es la GPU más grande que fabrica Intel, es su mayor matriz gráfica para clientes como tú y nosotros (usuarios normales y no servidores).
El diagrama de bloques es una disposición bastante estándar, aunque se parece más a la de Nvidia que a la de AMD. Con un total de 8 Render Slices, cada uno de los cuales contiene 4 Xe-Cores, para un total de 512 Vector Engines (el equivalente de Intel a los Stream Processors de AMD y los núcleos CUDA de Nvidia).
Además, cada Render Slice contiene una unidad de primitivas, un rasterizador, un procesador de búfer de profundidad, 32 unidades de textura y 16 ROPs. A primera vista, esta GPU parece bastante grande, ya que 256 TMUs y 128 ROPs son más de lo que se encuentra en una Radeon RX 6800 o GeForce RTX 2080.
Sin embargo, el chip RNDA 3 de AMD alberga 96 unidades de cálculo, cada una con 128 ALU, mientras que el ACM-G10 cuenta con un total de 32 núcleos Xe, con 128 ALU por núcleo. Por tanto, solo en términos de número de ALU, la GPU de Intel con tecnología Alchemist es un tercio del tamaño de la de AMD.
En comparación con la primera GPU Alchemist que Intel lanzó a través de proveedores OEM, este chip tiene todas las características de una arquitectura madura, en términos de número de componentes y disposición estructural. Por desgracia, están a años luz ahora mismo.
NVIDIA y su chip AD102, la joya de las RTX 4000
Terminamos nuestro repaso de los diferentes diseños con la AD102 de NVIDIA, su primera GPU que utiliza la arquitectura Ada Lovelace. Comparada con su predecesora, la Ampere GA102, no parece tan diferente, solo mucho más grande. Y a todos los efectos, lo es.
NVIDIA utiliza una jerarquía de componentes de un clúster de procesamiento gráfico (GPU) que contiene 6 clústeres de procesamiento de texturas (TPC), y cada uno de ellos alberga 2 multiprocesadores de flujo (SM).
En la matriz completa del AD102, el número de GPC ha pasado de 7 a 12, por lo que ahora hay un total de 144 SM, lo que da un total de 18.432 núcleos CUDA en la RTX 4090 y alguno menos en la RTX 4080. Esto puede parecer una cifra ridícula si se compara con los 6.144 SM de Navi 31, pero AMD y NVIDIA cuentan sus componentes de forma diferente.
Aunque esto es simplificar mucho las cosas, un SM de NVIDIA equivale a una CU de AMD: ambos contienen 128 ALU. Por tanto, mientras que Navi 31 tiene el doble de tamaño que el ACM-G10 de Intel, el AD102 es 3,5 veces mayor.
Por eso es injusto comparar el rendimiento de los chips cuando son tan claramente diferentes en términos de escala. Sin embargo, una vez que están dentro de una tarjeta gráfica, con su precio y su comercialización, la cosa cambia.
Con todos estos datos sobre la mesa, ahora deberías ser capaz de diferenciar de qué forma afronta cada marca su aproximación al gaming y a las tecnologías que hacen posible jugar a videojuegos en 4K y con raytracing. El mundo de las GPU no es fácil, pero sí muy interesante.
Con información de Computer Hoy