Esperamos mucho tiempo para que NVIDIA finalmente lanzara la arquitectura de GPUs Maxwell para tarjetas tope de línea. Esta espera terminó y la Geforce GTX 980 está aquí y al parecer, valió la pena. Así que pónganse cómodos por que aquí llega la revisión del GPU tope de línea del gigante verde, por Ozeros.
El desarrollo de GPUs no es tan diferente del de CPUs; una nueva arquitectura es introducida cada uno o dos años, ayudado por un nuevo proceso de silicio el cual permite a los diseñadores empaquetar mas transistores para incrementar el desempeño y reducir el tamaño de los chips. Es por esto razón, y una gran cantidad de metas de diseño en mente como un bajo consumo energético y alto desempeño, que NVIDIA esperaba alcanzar al proceso de 20nm para lanzar su producto tope de línea este año, pero lamentablemente esto no fue así, ya que los nodos para producción en volumen de silicios de 20nm aun no están disponibles. Es por esta razón que NVIDIA básicamente tuvo que ir por el plan B y quedarse en el proceso de 28nm. ¿Habrá sido una buena opción?, lo sabremos todo a continuación.
Hace como un año y medio atrás se hizo saber que NVIDIA estaba creando una nueva arquitectura de GPU bajo el nombre código “Maxwell”, si, nombrada como el físico y matemático James Clerk Maxwell y que seria la sucesora de la arquitectura Kepler, también nombrada por el matemático, astrónomo y astrólogo Johannes Kepler. Maxwell es la Décima generación de arquitectura de GPU de NVIDIA.
Arquitectura Maxwell
Maxwell 2da generación, un pequeño retoque
A principios de año NVIDIA daba aviso de la nueva arquitectura que traía entre manos, dando vida a los primeros chips basados en Maxwell con la GTX 750 ti y la GTX 750. En su interior venía el chip más eficiente (consumo/rendimiento) jama fabricado por la compañía, el GM107. Este chip introdujo las nuevas características de la arquitectura en donde se encontraban una optimizada unidad SMM (Straming Multiprocessors Maxwell), que evolucionaba de las SMX de Kepler, además de frecuencias bastante más altas gracias a un mejorado proceso en 28 nm, ya estaba bastante madurado. Hoy NVIDIA introduce al mercado un chip mayor basado en su arquitectura Maxwell, claro que lo de mayor no sólo está dado por el aumento de unidades SMM, sino que NVIDIA le ha dado un pequeño retoque a su organización interna para mantener la relación eficiencia y potencia, ahora en la parte alta. Como resultado tenernos la arquitectura Maxwell de segunda generación.
El nuevo GPU GM204
GM204 es el nombre del primer chip basado en Maxwell de segunda generación. Este GPU está fabricado en los ya clásicos 28 nm, proceso de fabricación que ya lleva 3 años en el mercado, dejando de lado los rumores de que NVIDIA fabricaría sus nuevos GPU de gama alta en 20 nm. Esto último debido a que el nuevo proceso de fabricación se ha visto constantemente retrasado y que probablemente ha puesto a NVIDIA a trabajar en un chip GM204 diferente.
Toda nueva arquitectura basa su aumento de rendimiento no sólo en la optimización de la arquitectura en sí, sino que también se basa en el aumento de unidades de procesamiento, lo que se traduce en un aumento de transistores. Por ello se busca en primera instancia, reducir el nanometraje (además de buscar más frecuencias y menor consumo) con tal de no aumentar el tamaño del chip. Si hay un aumento lineal, sin bajar el nanometraje, llevaría a un aumento de consumo y temperatura. Pero esto se puede contrarrestar con la optimización de la arquitectura y con el proceso en 28 nm madurado, factores con los que NVIDIA ha sacado ventajas.
GM204 se mantuvo en los 28 nm pero aumento su tamaño comparativamente con su símil en la arquitectura anterior Kepler. Recordemos que NVIDIA con Kepler no mostró, o no pudo mostrar todo el esplendor de la arquitectura y dejó a los chips de gama media en la parte alta del tablero (nomenclatura comercial). Ahora con Maxwell parece repetirse la historia quedando el GM204 en la parte media y dejando en el misterio un chip superior. Por ello podemos decir que el chip que se compara técnicamente con GM204 es el GPU GK104. Este último se compuso de nada más ni nada menos que 3500 millones de transistores, pero ahora se queda por debajo del GM204, el que se compone de 5200 millones de transistores. Casi 50% de aumento en la cantidad de transistores usados y que se distribuyen en un área de 398 mm2, v/s los 294 mm2 de GK204. Como vemos el área del chip ha aumentado lógicamente también, quedando un 35% arriba. Esto sin duda podría significar en un aumento de consumo, pero como ya hemos mencionado NVIDIA ha trabajado en optimizar su nueva arquitectura y además ha sacado provecho de la maduración en la fabricación de chips en 28 nm. NVIDIA ha sacado lo mejor de los 28 nm reorganizando su arquitectura Maxwell y dejándola en la parte alta con una relación consumo y rendimiento prometedora.
Las unidades SMM, GPC 2.0 y la nueva arquitectura de memoria
Toda arquitectura gráfica tiene sus unidades básicas de procesamiento y estas a su vez conforman unidades mayores que dibujan el diagrama del nuevo GPU. Para el caso de Maxwell continuamos hablando de CUDA cores y estos conforman las unidades SMM o Straming Multiprocessors Maxwel. Estos a su vez constituyen una unidad mayor que NVIDIA llama GPC (Graphics Processing Clusters), la cual es la unidad que finalmente conforma el chip en cuestión. Para el GM204 hablaremos 4 controladores de memoria de 64-bit conformando los 256-bit finales, 4 GPC los que se constituyen de 4 SMM y estos a su vez, se conforman de 128 SMM ¿Qué cambios hay con respecto a Kepler o versus Maxwell de primera generación?
Partimos por abajo. Las unidades SM como ya se introdujo en el primer chip de Maxwell GM107, pasan a llamarse SMM y se diferencian principalmente con las SMX de Kepler por los 128 CUDA cores que la conforman v/s los 192 CUDA cores de la anterior arquitectura. Ahora Maxwell de segunda generación es exactamente igual, conformándose por 128 CUDA cores agrupadas en32 unidades, con una motor PolyMorph 3.0 y 8 TMUs. Pero todo sería igual a no ser por los 96KB de memoria compartida de la unidad, que aumentan con respecto a los 64KB de Maxwell 1Gen.
Con los cambios realizados ahora cada CUDA core de Maxwell es 1.4 veces más rendidor y 2 veces más eficiente en rendimiento x watts. Ahora si hablamos de unidades SM, las SMM de Maxwell son un 33% más pequeñas que las SMX de Kepler, pero pueden entregar casi el mismo performance reduciendo el área y haciéndola más eficiente.
Pasamos a las unidades GPC donde el chip GM204 se conforma de 4 ellas, con un motor de rasterizado cada una, totalizando 2048 CUDA cores y 16 unidades SMM. Aquí volvemos a tener una leve diferencia con respecto a GM107, no sólo por el evidente aumento de unidades, sino por la conformación del GPC. Como les comentábamos, una unidad GPC del GM204 (Maxwell 2gen) lleva 4 unidades SMM en su interior, pero Maxwell 1gen posee 5 unidades. Por ello el chip GM107 de la GTX 750 Ti pasa a tener 640 CUDA cores, mientras que una unidad GPC de Maxwell 2gen pasa a tener 512 CUDA cores. Técnicamente la contracción que le ha dado NVIDIA a su nuevo GPU no se traduce en una pérdida de rendimiento, ya que las unidades básicas SMM prácticamente se mantienen intactas, pero si ha recurrido a jugar un poco más con el tamaño de su chip. Probablemente el diagrama original de 5 unidades SMM para la conformación de un GPC habría dado con un chip mayor, tanto en consumo como en rendimiento, pero NVIDIA necesitaba posicionar al GM204 en un rango menor, con tal de no alterar tanto su lineup, además de mantenerse en un consumo mucho menor.
Uno de los mayores cambios que vemos también en Maxwell con respecto a Kepler es la gran cantidad de cache L2, la cual se cuadruplica pasando de los 512KB en GK104 a los 2 MB de cache actuales. Con este incremento de cache Maxwell posee un mejor rendimiento sin incrementar el consumo. Los 2MB de cache L2 se componen de 4 pedazos de memoria cache de 512KB cada una y las cuales se componen de 16 ROPs, los que suman 64 unidades en total. Los ROPs también se incrementan bastante pasando al doble versus Kepler GK104. Con ello NVIDIA pretende aumentar el rendimiento a altas resoluciones y con filtros. Por otro lado tenemos ahora una gran memoria RAM de 4GB de 256-bit y la cual trabaja a 7Gbps. Aquí NVIDIA ha optimizado su arquitectura de memoria logrando usar alrededor de un 25% menos de bytes gracias a las mejoras en compresión de algoritmos y catching de memoria. Por ello si comparamos con Kepler, esta última arquitectura debería correr su memoria a 9,3Gbps para igualar a Maxwell.
Nuevas tecnologías; VXGI, DSR y MFAA para una mejor calidad de imagen
NVIDIA ha implementado una gran cantidad de nuevo hardware que detallamos en las líneas previas para entregarnos no sólo más rendimiento por menos consumo, sino que también para ver nuevas tecnologías que antes eran imposibles de implementar. Tres de estas son las que pasamos a repasar.
Voxel global Illumination (VGI): El render en tiempo real “dynamic Global Illumination” ahora es mejorado con la tecnología VXGI o “Voxel global Illumination” de NVIDIA.
La iluminación en tiempo real es uno de los procesos más complejos que realizan los GPUs hoy en día. Aquí hay dos formas en que se iluminan los objetos si hacemos la analogía al mundo real; luz directa e indirecta y esta última es la que realmente hace sufrir a un GPU. La luz directa es la que llega desde una fuente original al objeto y la indirecta es la que rebota de un objeto a otro. Con VXGI estos procesos se hacen menos pesados, ya que el espacio 3D de la escena pasa a ser “Voxelizado”. Esto es, pequeños cubos llamados Voxel que ocupan un espacio los cuales interactúan con la luz que viene de diferentes direcciones). Con esto lo que se busca es una imagen de mejor calidad y que represente de mejor forma la iluminación con respecto a una escena real.
Dynamic Super Resolution (DSR): Esta tecnología renderea la imagen a la más alta resolución, en este caso 4K, y luego la baja a la resolución nativa del monitor mediante “downsampling”. Con esto podemos tener calidad de imágenes en 4K en resoluciones a 1080p. Esta opción se puede encontrar en la App “GeForce Experience” y activarla con un simple click.
Multi-Frame Sampled AA (MFAA): Multisample anti-aliasing (MSAA) es la forma más común de usar filtros AA, pero esta técnica puede resultar muy costosa a altas resoluciones como 4K. Por ello NVIDIA ha desarrollado MFAA, filtro que no sufre bajas de fps a altas resoluciones. Esto gracias al nuevo hardware introducido en el GPU GM204. MFAA permite trabajar alternando dos filtros 2XAA para brindar una calidad de imagen similar a nuestros ojos que 4xMSAA.
Según NVIDIA, MFAA trabaja un 30% más rápido que MSAA y que esta tecnología de filtrado de imagen estará soportada en una gran cantidad de juegos.
Optimizaciones de latencia en juegos de realidad virtual
Uno de los juegos que están tomando fuerza hoy en día son los basados en la realidad virtual (VR). Esto gracias a Oculus Rift que ha permitido sumergirse en una nueva experiencia de juego. Por ello NVIDIA está tomando cartas en el asunto y ha optimizado su nuevo chip Maxwell para obtener mejores latencias y hacer la experiencia de juego VR mejor.
En VR si tu mueves la cabeza a una diferente posición el GPU trabaja en dibujar una nueva imagen en tiempo real lo más rápido posible pasando por diferentes procesos. Esta latencia actual es de 50 milisegundos, pero con un Maxwell esto se puede reducir hasta los 25ms.
Son tres los procesos con los cuales NVIDIA va reduciendo esta latencia. El primero es la optimización básica que los ingenieros de NVIDIA han logrado. Con ello tenemos una reducción de 10ms. Luego se reducen 4ms usando MFAA, del que les hablábamos. Finalmente tenemos una reducción 9 ms más para llegar a los 25ms de latencia entre el render del GPU hasta lo que se proyecta en nuestros ojos con “asynchronous warp” . Con esta técnica se usa un fotograma anterior para programar el que viene, lo que permite llegar a la latencia más baja.
Primer GPU en soportar HDMI 2.0
Maxwell no sólo está pensado para entregar el máximo rendimiento por el menor consumo posible, sino que además integra un nuevo motor de video. Este nuevo motor permite soportar resoluciones de hasta 5K (5120 x 3200). Todo con el fin de alcanzar las resoluciones que hoy en día están entregando los diferentes monitores. A esto agregamos también una característica bastante interesante y es que el GM204 (GTX980) es el primer GPU en soportar la conexión HDMI 2.0. Con ello pasamos desde HDMI 1.4 que soporta resoluciones 4K a 30Hz para RGB “444” pixels, y 60Hz para YUV “420” pixels a la nueva versión que soporta los mismo 4K pero a una resolución full RGB “444” pixels a 60 Hz.
Rendimiento en Desktop y Notebooks cada vez más cerca NVIDIA se ha esforzado en entregar el máximo rendimiento por el menor consumo con sus nuevos GPUs Maxwell, lo cual le ha permitido no solo tener opciones más potentes para desktop, sino que también le ha permitido tener soluciones para notebooks que cada vez se acercan en rendimiento a lo que hay en desktop. Año tras año la brecha se reduce y este 2014 una GPU para notebook tope de línea estará muy cerca del rendimiento de la tope de línea para desktop. Esto sin duda le da un plus más interesante a las máquinas gamers.
GM204 y el overclock
Una característica interesante que trae la GTX 980 es poder entregar la energía necesaria cuando se overclockea el GPU. En condiciones normales el GPU extrae energía de 3 fuentes (los dos conectores de 6 pines y la interfaz PCI-e) de forma balanceada, pero cuando aplicamos overclock la energía se extrae de una sola fuente de manera desbalanceada. Ahora esto no ocurre ya que si se extrae la máxima energía que puede entregar una fuente, automáticamente se extrae de otra fuente. Con ello es posible alcanzar más altas frecuencias y NVIDIA nos predice que e posible alcanzar frecuencias en torno a los 1400 MHz. Lamentablemente esta opción está solo presente en el diseño de la GTX 980, pero de igual manera esperamos encontrar grandes incrementos de frecuencias en los modelos no referenciales que estamos testeando. Esto gracias a la mejora en los coolers que le hacen los fabricantes a sus versiones de GTX 980.
El escenario actual de las nuevas tarjetas gráficas Maxwell
Cuando NVIDIA compara los números actuales del nuevo chip GM204 en su versión más potente, vemos que hay mejoras en todo sentido versus su símil técnico (GTX680/GTX770) y versus la versión comercial que está reemplazando (GTX780). Nuevamente se hace hincapié en alto rendimiento por watts y que el salto en rendimiento se duplica contra la arquitectura anterior.
En cuanto a la GTX 970, esta compite muy por sobre la GTX 670, sobre todo a altas resoluciones. En este ámbito la curva y la ventaja que puede sacar la actual serie es impresionante y más aun cuando aplicamos MFAA.
Ahora veremos cuanto nos impresiona en nuestros test la nueva GTX 970 en rendimiento y sabremos que tanto sirvió ahorrar esos transistores o unidades de procesamiento para tener un consumo de maravillas, en el rango en que se posiciona esta tarjeta, sin descuidar frecuencias.
Las nuevas GTX 980 y GTX970
Y llegamos a las nuevas bestias que el día de hoy lanza NVIDIA, la GTX 980 y la GTX 970. En esta última basamos nuestro review, pero pronto tendremos a su hermana mayor exponiendo su rendimiento. Ambas tarjetas gráficas se basan en el chip GM204 del que les hablamos extensamente al inicio, pero hay diferencias notables para conformar a cada una. Estas diferencias se basan principalmente en la deshabilitación de unidades, una maniobra clásica entre los fabricantes de chip para armar sus lineup. Como les hablábamos al inicio, la GTX 980 se conforma de 2048 CUDA cores, mientras que la GTX 970 baja a 1664 unidades. Una conformación bastante extraña ya que no hablamos de la deshabilitación de una unidad GPC entera sino que parte de ella. Por ello podríamos decir que la GTX 970 se conforma de 3 unidades GPC + 128 CUDA cores, o podríamos decir que son 13 SMM v/s las 16 unidades originales del GPU. Pero estos no son todos los detalles ya que hay otras unidades que entran en juego, así como frecuencias y que pasamos a detallar a continuación.
Modelo | GTX 970 | GTX 770 | GTX 980 | GTX 780 | GTX 780 Ti | GTX TITAN |
GPU | GM204 | GK104 | GM204 | GK110 | GK110 | GK110 |
Straming Multiprocessors | 13 | 8 | 16 | 12 | 15 | 14 |
CUDA Cores | 1664 | 1536 | 2048 | 2304 | 2880 | 2688 |
Texture Units | 128 | 128 | 128 | 192 | 240 | 224 |
Frecuencia GPU | 1050 MHz | 1046 MHz | 1126 MHz | 863 MHz | 875 MHz | 837 MHz |
Frecuencia Boost | 1178 MHz | 1085 MHz | 1216 MHz | 900 MHz | 928 MHz | 876 MHz |
L2 Cache | 2 MB | 512 KB | 2 MB | 1,5 MB | 1,5 MB | 1,5 MB |
Frecuencia memorias | 1750 | 1750 | 1750 | 1750 | 1500 | 1500 |
Memory Bus Width | 256-bit | 256-bit | 256-bit | 384-bit | 384-bit | 384-bit |
VRAM | 4 GB | 2 GB | 4 GB | 3 GB | 3 GB | 6 GB |
TDP | 145 watts | 230 Watts | 165 watts | 250 Watts | 250 Watts | 250 Watts |
Cant. de Transistores | 5200 Millones | 3500 Millones | 5200 Millones | 7100 Millones | 7100 Millones | 7100 Millones |
Proceso de fabricación | 28 nm | 28 nm | 28 nm | 28 nm | 28 nm | 28 nm |
Conectores de alimentación | 6pin + 6pin | 6pin + 8pin | 6pin + 6pin | 6pin + 8pin | 6pin + 8pin | 6pin + 8pin |
Fecha de lanzamiento | 19-sep-14 | 30-may-13 | 19-sep-14 | 23-may-13 | 07-nov-13 | 21-feb-13 |
Precio de lanzamiento | $ 329 | $ 399 | $ 549 | $ 649 | $ 699 | $ 999 |
Como vemos las diferencias entre la GTX 980 y la GTX 970 no son muchas y están dadas por la cantidad de CUDA cores y frecuencias principalmente. Por otro lado tenemos que las nuevas tarjetas pasan a tener nada menos que 4GB, quizá apuntando a las resoluciones 4K, ya que como rendimiento no afecta mucho tener 2, 3 ó 4 GB de memoria en una tarjeta. Por otro lado tenemos un TDP bastante bajo y que es sin duda uno de los principales factores diferenciadores de la nueva serie. La nueva arquitectura permite no sólo mantener una alta dosis de CUDA cores, sino que también frecuencias bastante altas y bajando el consumo. Realmente impresionante.
NVIDIA GeForce GTX 980 Frente a la Cámara
Primero, nos encontramos con una caja muy distinta a lo que estamos acostumbrados a ver. La parte superior se retira levantandola para luego revelar su interior.
En su interior encontramos, apoyada en una cama de goma, la nueva GTX 980.
En la parte superior nos encontramos con el logo GTX 980 en relieve.
En el costado, contamos con el logo GeForce GTX en color verde. Este logo se ilumina cuando nuestro PC esta encendido. Un bonito detalle.
En la parte posterior, la GTX 980 cuenta con dos conectores PCIe de energía de 6-pins.
Luego, nos encontramos con el ventilador del tipo blower encargado de refrigerar este monstruo
La GTX 980 cuenta con soporte Quad SLI y estos son los conectores que permiten la conexión entre tarjetas para lograr configuraciones multi-GPU.
En la parte posterior nos encontramos con una pletora de salidas de video. Podemos apreciar, un DVI, un HDMI, y tres Display Port.
NVIDIA GeForce GTX 980 en Profundidad
Una toma general de la GTX 980 en si máxima expresión. Procederemos a detallar mas profundamente mientras la desarmamos.
En la parte posterior esta cuenta con un backplate metálico para darle la rigidez extra que necesita para que no se tuerza una vez instalada en el puerto PCIe de nuestra placa madre.
Esta curiosa tapa cumple la función de proporcionar una entrada mas libre de aire para cuando montemos dos o mas tarjetas en SLI y los puertos PCIe estén muy cerca uno del otro. La tapa de saca y así permite la entrada de aire hacia el ventilador de la tarjeta que esta sobre la anterior.
Procedemos a retirar el backplate que mencionábamos anteriormente. Este se sujeta por catorce tornillos al disipador.
Una vez retirados los tornillos del backplate y los cuatro tornillos que sujetan el bloque principal del disipador al GPU, procedemos a retirar la carcasa completa. Podemos apreciar que este posee un bloque de Cobre solido para la disipación del GPU y que este hace contacto con pasta térmica. Luego podemos apreciar las gomas de disipación para el resto de los componentes de la tarjeta.
Y he aquí el PCB en toda su gloria y este tiene varios detalles que nos llaman la atención.
La entrega de energía llega a través de dos conectores de energía PCIe de 6-pins. Esta configuración está especificada para un consumo de 225W de energía. También podemos apreciar el conector de 2 pins de color blanco, encargado de entregarle energía al logo “GEFORCE GTX” de color verde que se encuentra en el costado. También podemos apreciar que este PCB está diseñado para recibir mas conectores de energía para versiones con overclocking o incluso puede que este mismo PCB se utilice para una próxima iteración.
En la parte inferior nos encontramos con algunos capacitores y bajo ellos está el conector de energía para el ventilador del tipo blower que vimos anteriormente.
NVIDIA decidió poner el controlador de voltaje OnSemi NCP81174 en su modelo referencial el cual tiene su propio PCB que va soldado a la placa. Este controlador no tiene soporte para I2C, así que no veremos un monitoreo avanzado aun que de igual forma los voltajes VID pueden ser monitoreados y controlados por el driver de NVIDIA.
Justo entre los chips de memoria y el regulador de voltaje que mencionábamos anteriormente se encuentran los chokes para las fases de poder de la GTX 980. Estas son del diseño 4+1 siendo cuatro fases para el GPU y una para las memorias.
Por el rededor del GPU nos encontramos con los chips de memoria. Estos son fabricados por Samsung y son del modelo K4G41325FC-HC28. Estos chips corren a una velocidad de 1750 MHz, o 7000 MHz efectivos GDDR5.
Y finalmente la estrella de esta revisión, el nuevo GPU GM204 que nos trae la arquitectura Maxwell a la plataforma tope de línea. Este es producido en el proceso de 28nm y es fabricado en la fab de TSMC en Taiwan. Con un conteo de transistores de 5200 millones en un área de 398 mm², este promete ser un gran GPU.
Plataforma de pruebas
Para esta revisión mantendremos parte de la plataforma de pruebas oficial para tratar de reducir a la mínima expresión las diferencias entre una y otras piezas. Con esto tenemos el procesador Intel Core i7-4790K, placa madre proporcionada por ASUS y finalmente almacenamiento Kingston. Agradecemos a cada uno de nuestros partners en proporcionar los componentes necesarios para mantener la plataforma de pruebas activa.
Plataforma Intel Haswell |
---|
Procesador | Intel Core i7 4790K @Stock |
Placa madre | ASUS ROG Maximus VII Ranger |
Memorias | HyperX Fury 1600 MHz 2x8GB |
Fuente de poder | XFX Pro 1000w Black Edition |
Tarjeta gráfica | NVIDIA GTX 980 Referencial MSI GTX 970 Gaming 4GB ASUS GTX 970 STRIX 4GB Sapphire Radeon R7 265 Dual-X MSI Radeon R9 270X Gaming ITX MSI Radeon R9 290 Gaming Edition GIGABYTE Radeon R9 280X Windforce Sapphire R9 290 Vapor-X NVIDIA GTX 780 Ti NVIDIA GTX 780 NVIDIA GTX 770 NVIDIA GTX 760 |
Almacenamiento | Kingston SSDNow V200+ 90GB |
Refrigeración | CPU: Refrigeración líquida – Custom |
Ventiladores | CPU: 3 x Scythe Ultra Kaze Sistema: 2 x Yate Loon |
Software | |
---|---|
Pruebas sintéticas | Futuremark 3DMark Vantage Futuremark 3DMark 11 Futuremark 3DMark (Año 2013) Unigine Heaven HWBot Edition Unigine Valley Extreme HD |
Juegos reales y Benchmark tools | Batman: Arkham Origins Battlefield 4 Crysis 3 GRID: Autosport Hitman: Absolution Metro: Last Light Tomb Raider |
Sistema operativo y controladores | Microsoft Windows 7 Ultimate 64 bit NVIDIA Geforce 344.11 WHQL |
Metodología de pruebas
Para esta sesión de pruebas hemos fijado el sistema a su velocidad de fábrica, entiéndase como procesador, memorias y tarjeta gráfica. Todas y cada una de las pruebas se corrieron un mínimo de 3 veces para evitar corridas falsas y aminorar el rango de error que siempre puede estar presente. Además, se configuró al máximo cada uno de los juegos en el apartado gráfico y filtro. Vale decir que cada configuración de filtros y detalles está expuesta en cada gráfico correspondiente. La tarjeta en cuestión quedará configurada de la siguiente manera durante todas las pruebas:
Benchmark Tool versus Escenas Reales
Hemos agregado títulos nuevos y más actuales a nuestra batería de pruebas, muchos de los cuales no vienen provistos con una propia escena prerenderizada establecida. Entendamos, antes que todo, la diferencia entre ambos: Por un lado tenemos los títulos benchmark tool (Metro Last Light, Hitman, Batman, Tomb Raider, GRID), los cuales son una escena predefinida que entrega un resultado final o un promedio de fotogramas por segundo. Por otro lado, las pruebas de escena real (Crysis 3 y Battlefield 4) son mapas dentro del mismo juego, las que se deben monitorear con el software pertinente para obtener un “mínimo, promedio y máximo” de cada prueba. Siempre se trata de “seguir el mismo camino” dentro de esta escena para no generar variaciones notables al momento de comparar. Dependiendo del punto de vista, un benchmark tool se puede ver poco real al momento de encasillar cierto rendimiento para X pieza a probar, sin embargo, nos sirve como punto de referencia para compartir resultados y experiencias entre todos los usuarios.
La importancia de los FPS
Tanto se habla de la cantidad de FPS (o frames per second; cuadros por segundo), y pocas veces uno se detiene a explicar de la mejor manera posible los valores ideales en cada caso. Acá tenemos 3 diferencias importantes para cada nivel de FPS.
30 FPS
Se supone que una persona normal, común y sin problemas visuales ve por lo general a 30 FPS, osea, ve 30 cuadros por segundo. Si llevamos esto a los juegos quiere decir que si obtenemos por lo menos 30 FPS veremos un juego fluido y jugable. Si bajamos de este rango tendremos los típicos escenarios donde el juego se convierte en una presentación en Power Point, y al fin de cuentas “molesta”.
60 FPS
Un jugador algo más entrenado, acostumbrado y, si se puede decir, más vicioso en el tema, reconocerá automáticamente cuando un juego está funcionando a más de 30 FPS. De hecho, en la mayoría de los títulos este valor es claramente notable: el juego se mueve mucho más suave, agradable a la vista y, dependiendo del motor de juego, hasta más rápida es la sensación.
120 FPS
La llegada de los monitores de 120 Hz y 3D ha puesto a prueba nuevamente al mercado. Básicamente los 120 FPS te aseguran un mínimo de 60 FPS al momento de jugar algo en 3D (recordemos que este sistema se basa en dos imágenes, una parte de los 120 cuadros por segundo para cada ojo). Entonces, si buscas tener una experiencia completa en 3D, los 120 FPS son tu número de lotería.
Consumo
Para calcular el consumo del equipo utilizamos el método del amperímetro y el multitester; El primero de ellos va midiendo una de las fases en el cable de salida hacia la línea energética de nuestro hogar, el segundo mide directamente la tensión en nuestro hogar. Multiplicando ambos factores obtendremos el consumo del equipo, expresado en Watts. Teniendo esto claro, usaremos dos estados de nuestro equipo para determinar los valores: En un principio, dejaremos el equipo en reposo durante 15 minutos para luego tomar cuenta de los valores entregados por las herramientas. Luego de eso, llevaremos cuenta del consumo en todos los benchmarks que utilizamos, para quedarnos con el registro más alto de ellos.
Temperaturas
Siguiendo el proceso anterior aprovechamos de registrar las temperaturas del GPU en cada una de las situaciones descritas en el párrafo de arriba, quedando finalmente como sigue a continuación:
NVIDIA GTX 980: Valores máximos | ||||
---|---|---|---|---|
Benchmark | Frecuencia | Temperatura | % TDP | % RPM |
3DMark Vantage | 1278,3 MHz | 66 °C | 82 % | 53 % |
3DMark 11 Perf. | 1278,3 MHz | 66 °C | 82 % | 51 % |
3DMark – Fire Strike | 1278,3 MHz | 68 °C | 85 % | 55 % |
3DMark – Sky Diver | 1278,3 MHz | 67 °C | 84 % | 53 % |
Unigine Heaven | 1278,3 MHz | 66°C | 82 % | 52 % |
Unigine Valley | 1278,3 MHz | 68 °C | 85 % | 55 % |
Batman: Origins | 1278,3 MHz | 63 °C | 80 % | 50 % |
Battlefield 4 | 1278,3 MHz | 64 °C | 80 % | 50 % |
Crysis 3 | 1278,3 MHz | 67 °C | 83 % | 54 % |
GRID: Autosport | 1278,3 MHz | 64 °C | 81 % | 51 % |
Hitman: Absolution | 1278,3 MHz | 67 °C | 84 % | 54 % |
Metro: Last Light | 1278,3 MHz | 68 °C | 85 % | 55 % |
Tomb Raider | 1278,3 MHz | 65 °C | 81% | 51 % |
Pruebas sintéticas: 3DMark y Unigine
El concepto de pruebas sintéticas se refiere a programas de uso demostrativo, con el fin de sólo entregar un puntaje en base a una escena pre-renderizada. Nada dentro del ciclo de pruebas es espontáneo, de hecho, cada movimiento, escena y toma viene predefinida. Muchos discuten sobre la veracidad de estos programas, pero actualmente son tan utilizados que se pueden tomar como referencia para comparar plataformas, sean del mismo tipo o con diferentes componentes. En nuestro caso usamos distintas pruebas sintéticas, o benchmarks, que abarcan variados rangos de exigencia y carga para la pieza en cuestión. Así, los programas que se han logrado ganar un puesto en nuestra batería son los 3DMark de Futuremark, junto a los dos mayores exponentes de la desarrolladora Unigine: Heaven y Valley. Todos con características distintas, aunque lo que los une es su gusto por hacer sufrir cuanta tarjeta gráfica se ponga por delante.
3DMark Vantage
3DMark 11
3DMark (año 2013)
Unigine Heaven – HWbot Edition
Unigine Valley
El más reciente exponente de Unigine es el nuevo “Valley”; Un hermoso paraje montañoso con unas tomas únicas de bosques y valles, con iluminación dinámica, cambios en el clima y teselación de alto nivel. Una maravilla para deleitar la vista y hacer sufrir VGA’s.
Benchmarks en Juegos
Dejamos atrás los fríos números de las pruebas sintéticas para buscar más acción y suspenso con la llegada de las pruebas reales. Nos referimos a ellas como pruebas reales ya que son juegos conocidos, que cualquier usuario como tu o yo podemos ejecutar en nuestros hogares. El 100% de las veces estas pruebas hacen uso de motores de juegos comerciales, y en algunos de estos casos, estas pruebas son con tintes variables, ya que a pesar de que los caminos están pre-definidos, los movimientos, acciones y reacciones del resto son completamente distintas de una u otra corrida.
Batman: Arkham Origins
Battlefield 4
Crysis 3
GRID: Autosport
Hitman: Absolution
Metro: Last Light
Tomb Raider
Eficiencia: Rendimiento vs consumo energético
Parte importante en la elección de una tarjeta gráfica adecuada y más aún con este competitivo rango de precios, es su nivel de rendimiento por cada unidad de Watt que consuma. Con esto podemos definir una relación de eficiencia energética que va de la mano con el ahorro y, como algunos la conocen, la compra ecológica o amiga del medio ambiente. Para definir este valor separaremos los resultados que claramente no pueden estar definidos en un mismo rango, como los FPS y un simple puntaje. En otras palabras, como todos los juegos que probamos nos entregan su resultado expresado en frames por segundo – FPS -, que mientras más alto es mejor, y los benchmarks nos entregan sus resultados en puntos, separaremos en dos grupos de valores cada expresión. Para determinar este valor, relación, expresión o como quieran llamarle, promediaremos cada grupo de resultados para luego dividirlo por el consumo en Watts. Con esto obtendremos, por así decirlo, la cantidad de cuadros por segundo o puntos, por cada Watts que el sistema consume. Más claro que el agua imposible.
Benchmarks
MODELO | CONSUMO | EFICIENCIA | ESTADO |
MSI GTX 980 Gaming 4GB | 319 Watts | 320,08 | Vigente |
NVIDIA GTX 980 4GB | 309 Watts | 320,08 | Vigente |
MSI GTX 970 Gaming 4GB | 285 Watts | 319,63 | Vigente |
ASUS GTX 970 STRIX 4GB | 298,6 Watts | 307,67 | Vigente |
ASUS GTX 750 Ti DCUII 2GB | 163,5 Watts | 298,52 | Vigente |
NVIDIA GTX 780 Ti 3GB | 378,3 Watts | 247,66 | Vigente |
NVIDIA GTX 770 2GB | 326,8 Watts | 241,01 | Vigente |
NVIDIA GTX 760 4GB | 289,5 Watts | 234,18 | Vigente |
AMD Radeon R7 265 2GB | 245,4 Watts | 223,46 | Vigente |
AMD Radeon R9 280X 3GB | 372,5 Watts | 218,15 | Vigente |
AMD Radeon R9 290 4GB | 429,1 Watts | 209,83 | Vigente |
Juegos
MODELO | CONSUMO | EFICIENCIA | ESTADO |
MSI GTX 980 Gaming 4GB | 319 Watts | 1,812 | Vigente |
ASUS GTX 970 STRIX 4GB | 298,6 Watts | 1,806 | Vigente |
NVIDIA GTX 980 4GB | 309 Watts | 1,796 | Vigente |
MSI GTX 970 Gaming 4GB | 285 Watts | 1,755 | Vigente |
NVIDIA GTX 780 Ti 3GB | 378,3 Watts | 1,539 | Vigente |
NVIDIA GTX 770 2GB | 326,8 Watts | 1,362 | Vigente |
AMD Radeon R9 290 4GB | 429,1 Watts | 1,245 | Vigente |
ASUS GTX 750 Ti DCUII 2GB | 163,5 Watts | 1,195 | Vigente |
NVIDIA GTX 760 4GB | 289,5 Watts | 1,151 | Vigente |
AMD Radeon R9 280X 3GB | 372,5 Watts | 1,141 | Vigente |
AMD Radeon R7 265 2GB | 245,4 Watts | 0,936 | Vigente |
Eficiencia: Rendimiento vs Precio de mercado
Parte de una buena inversión es adquirir una tarjeta que rinde por cada peso que estamos pagando. La siguiente tabla pretende hacernos una idea general de toda la gama de tarjetas gráficas que hemos probado.
Rendimiento vs Precio: Benchmarks
Precio actualizado 19-09-2014 en Newegg.com
MODELO | PRECIO | EFICIENCIA | ESTADO |
AMD Radeon R7 265 2GB | 149 USD | 223,46 | Vigente |
ASUS GTX 750 Ti DCUII 2GB | 149 USD | 298,52 | Vigente |
NVIDIA GTX 760 4GB | 249 USD | 234,18 | Vigente |
AMD Radeon R9 280X 3GB | 299 USD | 218,15 | Vigente |
ASUS GTX 970 STRIX 4GB | 339 USD | 307,67 | Vigente |
MSI GTX 970 Gaming 4GB | 349 USD | 319,63 | Vigente |
NVIDIA GTX 770 2GB | 329 USD | 241,01 | Vigente |
AMD Radeon R9 290 4GB | 399 USD | 209,83 | Vigente |
NVIDIA GTX 780 Ti 3GB | 599 USD | 247,66 | Vigente |
NVIDIA GTX 980 4GB | 549 USD | 179,27 | Vigente |
MSI GTX 980 Gaming 4GB | 579 USD | 176,35 | Vigente |
Rendimiento vs Precio: Juegos
Precio actualizado 19-09-2014 en Newegg.com
MODELO | PRECIO | EFICIENCIA | ESTADO |
ASUS GTX 970 STRIX 4GB | 339 USD | 1,59 | Vigente |
AMD Radeon R7 265 2GB | 149 USD | 1,54 | Vigente |
MSI GTX 970 Gaming 4GB | 349 USD | 1,43 | Vigente |
AMD Radeon R9 280X 3GB | 299 USD | 1,42 | Vigente |
NVIDIA GTX 770 2GB | 329 USD | 1,35 | Vigente |
AMD Radeon R9 290 4GB | 399 USD | 1,34 | Vigente |
NVIDIA GTX 760 4GB | 249 USD | 1,34 | Vigente |
ASUS GTX 750 Ti DCUII 2GB | 149 USD | 1,31 | Vigente |
NVIDIA GTX 980 4GB | 549 USD | 1,01 | Vigente |
MSI GTX 980 Gaming 4GB | 579 USD | 1,0 | Vigente |
NVIDIA GTX 780 Ti 3GB | 599 USD | 0,97 | Vigente |
Conclusiones
La GeForce GTX 980 es sin duda la mejor tarjeta tope de línea de diseño referencial que se ha lanzado en bastante tiempo. NVIDIA ha solucionado con éxito el desafío mas importante en el diseño actual de GPUs, el consumo energético.
En términos de desempeño, encontramos que la GTX 980 supera a la GTX 780 Ti, ya que teniendo menos núcleos CUDA, menos unidades de textura, casi 2000 millones de transistores menos y cerca de un 50% menos en el TDP, el GM204 se desempeña casi idénticamente que el GK110. Esto también nos indica de que el GM204 no será el chip más grande que NVIDIA piensa diseñar para esta arquitectura, así que podemos prepararnos para que el próximo año aparezca algún refresco de este GPU.
Cuando miramos desempeño, tenemos que mirar el consumo energético. En estos días, el consumo de energía es el factor que limita el desempeño de los GPUs ya que el calor y el ruido son lo que vienen a consecuencia de ello. Aparte, no se puede disipar mucho calor en una tarjeta gráfica y mantenerla silenciosa al mismo tiempo. La primera vez que vimos el gran avance en la eficiencia energética de Maxwell fue con la GTX 750Ti y ahora podemos ver que NVIDIA ha logrado llevar esas mejoras a su producto tope de línea. La GTX 980 utilizó en promedio unos 153W de la plataforma en nuestras pruebas, lo cual es algo increíblemente bajo para una tarjeta con este desempeño. Ahora, si miramos la competencia, AMD con el GPU Tonga consume 50W mas por casi la mitad del desempeño de Maxwell.
Otra de las cosas que NVIDIA ha mejorado es el consumo de energía en momentos de reposo o cuando no se está jugando, lo cual es algo importante para usuarios que no juegan todo el día, pero si trabajan con sus máquinas y que pasan largos periodos de tiempo en reposo.
Ahora, hablaremos de precios. la GeForce GTX 980 se venderá en el retail en alrededor de 550U$. Viendo el pasado de NVIDIA, el precio esta dentro del margen razonable y quizá algo mas bajo de lo que esperábamos. En este segmento de precios la GTX 980 le gana a la Radeon R9 290X en todo: Precio/rendimiento, Rendimiento Absoluto, Rendimiento por watt, consumo energético, calor y ruido.
En los próximos días, llegaran a las tiendas las GTX 980 y varios fabricantes ya tienen listos sus modelos no referenciales y varios de ellos estarán aquí en Ozeros. Así que a estar atentos por que se viene bueno.
En resumen, la GTX 980 es una maravilla en desempeño. Realmente NVIDIA hizo el trabajo como correspondía y nos sorprendió de una grata forma con una tarjeta tope de línea que rinde lo que promete. Es por esto que le otorgamos los premios de Producto Recomendado y Rendimiento Máximo.
Y antes de cerrar esta revisión, no olvides seguirnos en las redes sociales de Facebook y Twitter, donde los mantendremos al día de los hechos noticiosos y podrán saber detalles exclusivos de la llegada de nuevas piezas de reviews, récords de overclock, tips, resolución de dudas, etc.