El CEO de NVIDIA, Jensen Huang, presentó virtualmente su nueva generación de GPUs pensadas para servidores y centros de datos, especialmente en las áreas de investigación de inteligencia artificial. Además, confirmó que esta misma arquitectura será utilizada para las siguientes generaciones de productos Quadro y GeForce.
Según NVIDIA, el futuro de la computación está en los data center, y para lograr esto se necesitan varias mejoras, desde la arquitectura de CPUs y GPUs, como estos se conectan, el rendimiento que se gana por cada silicio por generación, hasta las soluciones de software y hardware para implementar data center completos. De todas maneras, el inicio de esto según ellos es una nueva arquitectura de GPUs, optimizada para este tipo de flujos de trabajos.
La NVIDIA A100 es la primera GPU basada en la arquitectura Ampere, entregando el mayor salto hasta la fecha de rendimiento en casi 8 generaciones de tarjetas gráficas. Ampere, que será usada también como plataforma para las GPUs GeForce y Quadro que NVIDIA anunciará durante los próximos meses, está optimizada para entrenamiento de AI, computo de alto nivel y aceleración para tareas de datos.
La A100 y la arquitectura Ampere aumentan el rendimiento hasta 20 veces en comparación a las generaciones predecesoras, según lo que dijo Huang. Entre los detalles que entregó están:
- Mas de 54 mil millones de transistores, siendo el procesador de 7nm más grande del mundo
- Tensor Cores de tercera generación con TF32, una nueva forma de acelerar el desarrollo IA. Los Tensor Core ahora son más flexibles, rápidos y fáciles de implementar
- Multi-instance GPU, que permite particionar un solo A100 hasta en 7 unidades independientes, cada una con sus propios recursos
- Tercera generación de la tecnología NVLink, duplicando la conectividad de alta velocidad entre GPUs, permitiendo que un server A100 actué como una sola GPU gigante
El resultado de esto es 6 veces el rendimiento de Volta para entrenamiento de IA, y 7 veces el rendimiento para inferencia de datos. Un NVIDIA DGX tiene 5 petaflops de rendimiento.
Por otra parte,el CEO de NVIDIA mencionó que Ampere será utilizada tanto para aceleradores computacionales como para productos comerciales, como las tarjetas GeForce para gamers y Quadro para profesionales. El lanzamiento de nuevas GPUs Ampere para jugadores se espera sea en una fecha cercana al lanzamiento de Cyberpunk 2077, en septiembre de este año.