Review: Tarjeta Gráfica NVIDIA Geforce GTX 980 4GB. La nueva joya de rendimiento y eficiencia

By J. Pablo Hurtado • 10 años ago

Oct
2014

Esperamos mucho tiempo para que NVIDIA finalmente lanzara la arquitectura de GPUs Maxwell para tarjetas tope de línea. Esta espera terminó y la Geforce GTX 980 está aquí y al parecer, valió la pena. Así que pónganse cómodos por que aquí llega la revisión del GPU tope de línea del gigante verde, por Ozeros.

El desarrollo de GPUs no es tan diferente del de CPUs; una nueva arquitectura es introducida cada uno o dos años, ayudado por un nuevo proceso de silicio el cual permite a los diseñadores empaquetar mas transistores para incrementar el desempeño y reducir el tamaño de los chips. Es por esto razón, y una gran cantidad de metas de diseño en mente como un bajo consumo energético y alto desempeño, que NVIDIA esperaba alcanzar al proceso de 20nm para lanzar su producto tope de línea este año, pero lamentablemente esto no fue así, ya que los nodos para producción en volumen de silicios de 20nm aun no están disponibles. Es por esta razón que NVIDIA básicamente tuvo que ir por el plan B y quedarse en el proceso de 28nm. ¿Habrá sido una buena opción?, lo sabremos todo a continuación.

Hace como un año y medio atrás se hizo saber que NVIDIA estaba creando una nueva arquitectura de GPU bajo el nombre código “Maxwell”, si, nombrada como el físico y matemático James Clerk Maxwell y que seria la sucesora de la arquitectura Kepler, también nombrada por el matemático, astrónomo y astrólogo Johannes Kepler. Maxwell es la Décima generación de arquitectura de GPU de NVIDIA.

Arquitectura Maxwell

Maxwell_GM204_DIE_3D_V17_Final

Maxwell 2da generación, un pequeño retoque

A principios de año NVIDIA daba aviso de la nueva arquitectura que traía entre manos, dando vida a los primeros chips basados en Maxwell con la GTX 750 ti y la GTX 750. En su interior venía el chip más eficiente (consumo/rendimiento) jama fabricado por la compañía, el GM107. Este chip introdujo las nuevas características de la arquitectura en donde se encontraban una optimizada unidad SMM (Straming Multiprocessors Maxwell), que evolucionaba de las SMX de Kepler, además de frecuencias bastante más altas gracias a un mejorado proceso en 28 nm, ya estaba bastante madurado. Hoy NVIDIA introduce al mercado un chip mayor basado en su arquitectura Maxwell, claro que lo de mayor no sólo está dado por el aumento de unidades SMM, sino que NVIDIA le ha dado un pequeño retoque a su organización interna para mantener la relación eficiencia y potencia, ahora en la parte alta. Como resultado tenernos la arquitectura Maxwell de segunda generación.

El nuevo GPU GM204

GM204 es el nombre del primer chip basado en Maxwell de segunda generación. Este GPU está fabricado en los ya clásicos 28 nm, proceso de fabricación que ya lleva 3 años en el mercado, dejando de lado los rumores de que NVIDIA fabricaría sus nuevos GPU de gama alta en 20 nm. Esto último debido a que el nuevo proceso de fabricación se ha visto constantemente retrasado y que probablemente ha puesto a NVIDIA a trabajar en un chip GM204 diferente.

Toda nueva arquitectura basa su aumento de rendimiento no sólo en la optimización de la arquitectura en sí, sino que también se basa en el aumento de unidades de procesamiento, lo que se traduce en un aumento de transistores. Por ello se busca en primera instancia, reducir el nanometraje (además de buscar más frecuencias y menor consumo) con tal de no aumentar el tamaño del chip. Si hay un aumento lineal, sin bajar el nanometraje, llevaría a un aumento de consumo y temperatura. Pero esto se puede contrarrestar con la optimización de la arquitectura y con el proceso en 28 nm madurado, factores con los que NVIDIA ha sacado ventajas.

GM204 se mantuvo en los 28 nm pero aumento su tamaño comparativamente con su símil en la arquitectura anterior Kepler. Recordemos que NVIDIA con Kepler no mostró, o no pudo mostrar todo el esplendor de la arquitectura y dejó a los chips de gama media en la parte alta del tablero (nomenclatura comercial). Ahora con Maxwell parece repetirse la historia quedando el GM204 en la parte media y dejando en el misterio un chip superior. Por ello podemos decir que el chip que se compara técnicamente con GM204 es el GPU GK104. Este último se compuso de nada más ni nada menos que 3500 millones de transistores, pero ahora se queda por debajo del GM204, el que se compone de 5200 millones de transistores. Casi 50% de aumento en la cantidad de transistores usados y que se distribuyen en un área de 398 mm2, v/s los 294 mm2 de GK204. Como vemos el área del chip ha aumentado lógicamente también, quedando un 35% arriba. Esto sin duda podría significar en un aumento de consumo, pero como ya hemos mencionado NVIDIA ha trabajado en optimizar su nueva arquitectura y además ha sacado provecho de la maduración en la fabricación de chips en 28 nm. NVIDIA ha sacado lo mejor de los 28 nm reorganizando su arquitectura Maxwell y dejándola en la parte alta con una relación consumo y rendimiento prometedora.

Las unidades SMM, GPC 2.0 y la nueva arquitectura de memoria

Toda arquitectura gráfica tiene sus unidades básicas de procesamiento y estas a su vez conforman unidades mayores que dibujan el diagrama del nuevo GPU. Para el caso de Maxwell continuamos hablando de CUDA cores y estos conforman las unidades SMM o Straming Multiprocessors Maxwel. Estos a su vez constituyen una unidad mayor que NVIDIA llama GPC (Graphics Processing Clusters), la cual es la unidad que finalmente conforma el chip en cuestión. Para el GM204 hablaremos 4 controladores de memoria de 64-bit conformando los 256-bit finales, 4 GPC los que se constituyen de 4 SMM y estos a su vez, se conforman de 128 SMM ¿Qué cambios hay con respecto a Kepler o versus Maxwell de primera generación?

GM204 spec

Partimos por abajo. Las unidades SM como ya se introdujo en el primer chip de Maxwell GM107, pasan a llamarse SMM y se diferencian principalmente con las SMX de Kepler por los 128 CUDA cores que la conforman v/s los 192 CUDA cores de la anterior arquitectura. Ahora Maxwell de segunda generación es exactamente igual, conformándose por 128 CUDA cores agrupadas en32 unidades, con una motor PolyMorph 3.0 y 8 TMUs. Pero todo sería igual a no ser por los 96KB de memoria compartida de la unidad, que aumentan con respecto a los 64KB de Maxwell 1Gen.

Con los cambios realizados ahora cada CUDA core de Maxwell es 1.4 veces más rendidor y 2 veces más eficiente en rendimiento x watts. Ahora si hablamos de unidades SM, las SMM de Maxwell son un 33% más pequeñas que las SMX de Kepler, pero pueden entregar casi el mismo performance reduciendo el área y haciéndola más eficiente.

Pasamos a las unidades GPC donde el chip GM204 se conforma de 4 ellas, con un motor de rasterizado cada una, totalizando 2048 CUDA cores y 16 unidades SMM. Aquí volvemos a tener una leve diferencia con respecto a GM107, no sólo por el evidente aumento de unidades, sino por la conformación del GPC. Como les comentábamos, una unidad GPC del GM204 (Maxwell 2gen) lleva 4 unidades SMM en su interior, pero Maxwell 1gen posee 5 unidades. Por ello el chip GM107 de la GTX 750 Ti pasa a tener 640 CUDA cores, mientras que una unidad GPC de Maxwell 2gen pasa a tener 512 CUDA cores. Técnicamente la contracción que le ha dado NVIDIA a su nuevo GPU no se traduce en una pérdida de rendimiento, ya que las unidades básicas SMM prácticamente se mantienen intactas, pero si ha recurrido a jugar un poco más con el tamaño de su chip. Probablemente el diagrama original de 5 unidades SMM para la conformación de un GPC habría dado con un chip mayor, tanto en consumo como en rendimiento, pero NVIDIA necesitaba posicionar al GM204 en un rango menor, con tal de no alterar tanto su lineup, además de mantenerse en un consumo mucho menor.

Uno de los mayores cambios que vemos también en Maxwell con respecto a Kepler es la gran cantidad de cache L2, la cual se cuadruplica pasando de los 512KB en GK104 a los 2 MB de cache actuales. Con este incremento de cache Maxwell posee un mejor rendimiento sin incrementar el consumo. Los 2MB de cache L2 se componen de 4 pedazos de memoria cache de 512KB cada una y las cuales se componen de 16 ROPs, los que suman 64 unidades en total. Los ROPs también se incrementan bastante pasando al doble versus Kepler GK104. Con ello NVIDIA pretende aumentar el rendimiento a altas resoluciones y con filtros. Por otro lado tenemos ahora una gran memoria RAM de 4GB de 256-bit y la cual trabaja a 7Gbps. Aquí NVIDIA ha optimizado su arquitectura de memoria logrando usar alrededor de un 25% menos de bytes gracias a las mejoras en compresión de algoritmos y catching de memoria. Por ello si comparamos con Kepler, esta última arquitectura debería correr su memoria a 9,3Gbps para igualar a Maxwell.

Arquitectura de memoria

Nuevas tecnologías; VXGI, DSR y MFAA para una mejor calidad de imagen

NVIDIA ha implementado una gran cantidad de nuevo hardware que detallamos en las líneas previas para entregarnos no sólo más rendimiento por menos consumo, sino que también para ver nuevas tecnologías que antes eran imposibles de implementar. Tres de estas son las que pasamos a repasar.

Voxel global Illumination (VGI): El render en tiempo real “dynamic Global Illumination” ahora es mejorado con la tecnología VXGI o “Voxel global Illumination” de NVIDIA.
La iluminación en tiempo real es uno de los procesos más complejos que realizan los GPUs hoy en día. Aquí hay dos formas en que se iluminan los objetos si hacemos la analogía al mundo real; luz directa e indirecta y esta última es la que realmente hace sufrir a un GPU. La luz directa es la que llega desde una fuente original al objeto y la indirecta es la que rebota de un objeto a otro. Con VXGI estos procesos se hacen menos pesados, ya que el espacio 3D de la escena pasa a ser “Voxelizado”. Esto es, pequeños cubos llamados Voxel que ocupan un espacio los cuales interactúan con la luz que viene de diferentes direcciones). Con esto lo que se busca es una imagen de mejor calidad y que represente de mejor forma la iluminación con respecto a una escena real.

VOXEL

Dynamic Super Resolution (DSR): Esta tecnología renderea la imagen a la más alta resolución, en este caso 4K, y luego la baja a la resolución nativa del monitor mediante “downsampling”. Con esto podemos tener calidad de imágenes en 4K en resoluciones a 1080p. Esta opción se puede encontrar en la App “GeForce Experience” y activarla con un simple click.

4K a 1080p

Multi-Frame Sampled AA (MFAA): Multisample anti-aliasing (MSAA) es la forma más común de usar filtros AA, pero esta técnica puede resultar muy costosa a altas resoluciones como 4K. Por ello NVIDIA ha desarrollado MFAA, filtro que no sufre bajas de fps a altas resoluciones. Esto gracias al nuevo hardware introducido en el GPU GM204. MFAA permite trabajar alternando dos filtros 2XAA para brindar una calidad de imagen similar a nuestros ojos que 4xMSAA.

MFAA

Según NVIDIA, MFAA trabaja un 30% más rápido que MSAA y que esta tecnología de filtrado de imagen estará soportada en una gran cantidad de juegos.

Optimizaciones de latencia en juegos de realidad virtual

Uno de los juegos que están tomando fuerza hoy en día son los basados en la realidad virtual (VR). Esto gracias a Oculus Rift que ha permitido sumergirse en una nueva experiencia de juego. Por ello NVIDIA está tomando cartas en el asunto y ha optimizado su nuevo chip Maxwell para obtener mejores latencias y hacer la experiencia de juego VR mejor.
En VR si tu mueves la cabeza a una diferente posición el GPU trabaja en dibujar una nueva imagen en tiempo real lo más rápido posible pasando por diferentes procesos. Esta latencia actual es de 50 milisegundos, pero con un Maxwell esto se puede reducir hasta los 25ms.

Son tres los procesos con los cuales NVIDIA va reduciendo esta latencia. El primero es la optimización básica que los ingenieros de NVIDIA han logrado. Con ello tenemos una reducción de 10ms. Luego se reducen 4ms usando MFAA, del que les hablábamos. Finalmente tenemos una reducción 9 ms más para llegar a los 25ms de latencia entre el render del GPU hasta lo que se proyecta en nuestros ojos con “asynchronous warp” . Con esta técnica se usa un fotograma anterior para programar el que viene, lo que permite llegar a la latencia más baja.

Primer GPU en soportar HDMI 2.0

Maxwell no sólo está pensado para entregar el máximo rendimiento por el menor consumo posible, sino que además integra un nuevo motor de video. Este nuevo motor permite soportar resoluciones de hasta 5K (5120 x 3200). Todo con el fin de alcanzar las resoluciones que hoy en día están entregando los diferentes monitores. A esto agregamos también una característica bastante interesante y es que el GM204 (GTX980) es el primer GPU en soportar la conexión HDMI 2.0. Con ello pasamos desde HDMI 1.4 que soporta resoluciones 4K a 30Hz para RGB “444” pixels, y 60Hz para YUV “420” pixels a la nueva versión que soporta los mismo 4K pero a una resolución full RGB “444” pixels a 60 Hz.

Rendimiento en Desktop y Notebooks cada vez más cerca NVIDIA se ha esforzado en entregar el máximo rendimiento por el menor consumo con sus nuevos GPUs Maxwell, lo cual le ha permitido no solo tener opciones más potentes para desktop, sino que también le ha permitido tener soluciones para notebooks que cada vez se acercan en rendimiento a lo que hay en desktop. Año tras año la brecha se reduce y este 2014 una GPU para notebook tope de línea estará muy cerca del rendimiento de la tope de línea para desktop. Esto sin duda le da un plus más interesante a las máquinas gamers.

NTBK=PC

GM204 y el overclock

Una característica interesante que trae la GTX 980 es poder entregar la energía necesaria cuando se overclockea el GPU. En condiciones normales el GPU extrae energía de 3 fuentes (los dos conectores de 6 pines y la interfaz PCI-e) de forma balanceada, pero cuando aplicamos overclock la energía se extrae de una sola fuente de manera desbalanceada. Ahora esto no ocurre ya que si se extrae la máxima energía que puede entregar una fuente, automáticamente se extrae de otra fuente. Con ello es posible alcanzar más altas frecuencias y NVIDIA nos predice que e posible alcanzar frecuencias en torno a los 1400 MHz. Lamentablemente esta opción está solo presente en el diseño de la GTX 980, pero de igual manera esperamos encontrar grandes incrementos de frecuencias en los modelos no referenciales que estamos testeando. Esto gracias a la mejora en los coolers que le hacen los fabricantes a sus versiones de GTX 980.

El escenario actual de las nuevas tarjetas gráficas Maxwell

Cuando NVIDIA compara los números actuales del nuevo chip GM204 en su versión más potente, vemos que hay mejoras en todo sentido versus su símil técnico (GTX680/GTX770) y versus la versión comercial que está reemplazando (GTX780). Nuevamente se hace hincapié en alto rendimiento por watts y que el salto en rendimiento se duplica contra la arquitectura anterior.

680 va 980 2

En cuanto a la GTX 970, esta compite muy por sobre la GTX 670, sobre todo a altas resoluciones. En este ámbito la curva y la ventaja que puede sacar la actual serie es impresionante y más aun cuando aplicamos MFAA.

970 vs 670

Ahora veremos cuanto nos impresiona en nuestros test la nueva GTX 970 en rendimiento y sabremos que tanto sirvió ahorrar esos transistores o unidades de procesamiento para tener un consumo de maravillas, en el rango en que se posiciona esta tarjeta, sin descuidar frecuencias.

Las nuevas GTX 980 y GTX970

Y llegamos a las nuevas bestias que el día de hoy lanza NVIDIA, la GTX 980 y la GTX 970. En esta última basamos nuestro review, pero pronto tendremos a su hermana mayor exponiendo su rendimiento. Ambas tarjetas gráficas se basan en el chip GM204 del que les hablamos extensamente al inicio, pero hay diferencias notables para conformar a cada una. Estas diferencias se basan principalmente en la deshabilitación de unidades, una maniobra clásica entre los fabricantes de chip para armar sus lineup. Como les hablábamos al inicio, la GTX 980 se conforma de 2048 CUDA cores, mientras que la GTX 970 baja a 1664 unidades. Una conformación bastante extraña ya que no hablamos de la deshabilitación de una unidad GPC entera sino que parte de ella. Por ello podríamos decir que la GTX 970 se conforma de 3 unidades GPC + 128 CUDA cores, o podríamos decir que son 13 SMM v/s las 16 unidades originales del GPU. Pero estos no son todos los detalles ya que hay otras unidades que entran en juego, así como frecuencias y que pasamos a detallar a continuación.

Modelo	GTX 970	GTX 770	GTX 980	GTX 780	GTX 780 Ti	GTX TITAN
GPU	GM204	GK104	GM204	GK110	GK110	GK110
Straming Multiprocessors	13	8	16	12	15	14
CUDA Cores	1664	1536	2048	2304	2880	2688
Texture Units	128	128	128	192	240	224
Frecuencia GPU	1050 MHz	1046 MHz	1126 MHz	863 MHz	875 MHz	837 MHz
Frecuencia Boost	1178 MHz	1085 MHz	1216 MHz	900 MHz	928 MHz	876 MHz
L2 Cache	2 MB	512 KB	2 MB	1,5 MB	1,5 MB	1,5 MB
Frecuencia memorias	1750	1750	1750	1750	1500	1500
Memory Bus Width	256-bit	256-bit	256-bit	384-bit	384-bit	384-bit
VRAM	4 GB	2 GB	4 GB	3 GB	3 GB	6 GB
TDP	145 watts	230 Watts	165 watts	250 Watts	250 Watts	250 Watts
Cant. de Transistores	5200 Millones	3500 Millones	5200 Millones	7100 Millones	7100 Millones	7100 Millones
Proceso de fabricación	28 nm	28 nm	28 nm	28 nm	28 nm	28 nm
Conectores de alimentación	6pin + 6pin	6pin + 8pin	6pin + 6pin	6pin + 8pin	6pin + 8pin	6pin + 8pin
Fecha de lanzamiento	19-sep-14	30-may-13	19-sep-14	23-may-13	07-nov-13	21-feb-13
Precio de lanzamiento	$ 329	$ 399	$ 549	$ 649	$ 699	$ 999

Como vemos las diferencias entre la GTX 980 y la GTX 970 no son muchas y están dadas por la cantidad de CUDA cores y frecuencias principalmente. Por otro lado tenemos que las nuevas tarjetas pasan a tener nada menos que 4GB, quizá apuntando a las resoluciones 4K, ya que como rendimiento no afecta mucho tener 2, 3 ó 4 GB de memoria en una tarjeta. Por otro lado tenemos un TDP bastante bajo y que es sin duda uno de los principales factores diferenciadores de la nueva serie. La nueva arquitectura permite no sólo mantener una alta dosis de CUDA cores, sino que también frecuencias bastante altas y bajando el consumo. Realmente impresionante.

NVIDIA GeForce GTX 980 Frente a la Cámara

Primero, nos encontramos con una caja muy distinta a lo que estamos acostumbrados a ver. La parte superior se retira levantandola para luego revelar su interior.

En su interior encontramos, apoyada en una cama de goma, la nueva GTX 980.

NVIDIA-GTX980-5

En la parte superior nos encontramos con el logo GTX 980 en relieve.

NVIDIA-GTX980-7

En el costado, contamos con el logo GeForce GTX en color verde. Este logo se ilumina cuando nuestro PC esta encendido. Un bonito detalle.

En la parte posterior, la GTX 980 cuenta con dos conectores PCIe de energía de 6-pins.

Luego, nos encontramos con el ventilador del tipo blower encargado de refrigerar este monstruo

La GTX 980 cuenta con soporte Quad SLI y estos son los conectores que permiten la conexión entre tarjetas para lograr configuraciones multi-GPU.

En la parte posterior nos encontramos con una pletora de salidas de video. Podemos apreciar, un DVI, un HDMI, y tres Display Port.

NVIDIA GeForce GTX 980 en Profundidad

NVIDIA-GTX980-3

Una toma general de la GTX 980 en si máxima expresión. Procederemos a detallar mas profundamente mientras la desarmamos.

NVIDIA-GTX980-4

En la parte posterior esta cuenta con un backplate metálico para darle la rigidez extra que necesita para que no se tuerza una vez instalada en el puerto PCIe de nuestra placa madre.

NVIDIA-GTX980-10

Esta curiosa tapa cumple la función de proporcionar una entrada mas libre de aire para cuando montemos dos o mas tarjetas en SLI y los puertos PCIe estén muy cerca uno del otro. La tapa de saca y así permite la entrada de aire hacia el ventilador de la tarjeta que esta sobre la anterior.

NVIDIA-GTX980-14

Procedemos a retirar el backplate que mencionábamos anteriormente. Este se sujeta por catorce tornillos al disipador.

NVIDIA-GTX980-13

Una vez retirados los tornillos del backplate y los cuatro tornillos que sujetan el bloque principal del disipador al GPU, procedemos a retirar la carcasa completa. Podemos apreciar que este posee un bloque de Cobre solido para la disipación del GPU y que este hace contacto con pasta térmica. Luego podemos apreciar las gomas de disipación para el resto de los componentes de la tarjeta.

NVIDIA-GTX980-12

Y he aquí el PCB en toda su gloria y este tiene varios detalles que nos llaman la atención.

La entrega de energía llega a través de dos conectores de energía PCIe de 6-pins. Esta configuración está especificada para un consumo de 225W de energía. También podemos apreciar el conector de 2 pins de color blanco, encargado de entregarle energía al logo “GEFORCE GTX” de color verde que se encuentra en el costado. También podemos apreciar que este PCB está diseñado para recibir mas conectores de energía para versiones con overclocking o incluso puede que este mismo PCB se utilice para una próxima iteración.

En la parte inferior nos encontramos con algunos capacitores y bajo ellos está el conector de energía para el ventilador del tipo blower que vimos anteriormente.

NVIDIA decidió poner el controlador de voltaje OnSemi NCP81174 en su modelo referencial el cual tiene su propio PCB que va soldado a la placa. Este controlador no tiene soporte para I2C, así que no veremos un monitoreo avanzado aun que de igual forma los voltajes VID pueden ser monitoreados y controlados por el driver de NVIDIA.

NVIDIA-GTX980-15

Justo entre los chips de memoria y el regulador de voltaje que mencionábamos anteriormente se encuentran los chokes para las fases de poder de la GTX 980. Estas son del diseño 4+1 siendo cuatro fases para el GPU y una para las memorias.

Por el rededor del GPU nos encontramos con los chips de memoria. Estos son fabricados por Samsung y son del modelo K4G41325FC-HC28. Estos chips corren a una velocidad de 1750 MHz, o 7000 MHz efectivos GDDR5.

Y finalmente la estrella de esta revisión, el nuevo GPU GM204 que nos trae la arquitectura Maxwell a la plataforma tope de línea. Este es producido en el proceso de 28nm y es fabricado en la fab de TSMC en Taiwan. Con un conteo de transistores de 5200 millones en un área de 398 mm², este promete ser un gran GPU.

Plataforma de pruebas

Para esta revisión mantendremos parte de la plataforma de pruebas oficial para tratar de reducir a la mínima expresión las diferencias entre una y otras piezas. Con esto tenemos el procesador Intel Core i7-4790K, placa madre proporcionada por ASUS y finalmente almacenamiento Kingston. Agradecemos a cada uno de nuestros partners en proporcionar los componentes necesarios para mantener la plataforma de pruebas activa.

Plataforma Intel Haswell

Software
Procesador	Intel Core i7 4790K @Stock
Placa madre	ASUS ROG Maximus VII Ranger
Memorias	HyperX Fury 1600 MHz 2x8GB
Fuente de poder	XFX Pro 1000w Black Edition
Tarjeta gráfica	NVIDIA GTX 980 Referencial MSI GTX 970 Gaming 4GB ASUS GTX 970 STRIX 4GB Sapphire Radeon R7 265 Dual-X MSI Radeon R9 270X Gaming ITX MSI Radeon R9 290 Gaming Edition GIGABYTE Radeon R9 280X Windforce Sapphire R9 290 Vapor-X NVIDIA GTX 780 Ti NVIDIA GTX 780 NVIDIA GTX 770 NVIDIA GTX 760
Almacenamiento	Kingston SSDNow V200+ 90GB
Refrigeración	CPU: Refrigeración líquida – Custom
Ventiladores	CPU: 3 x Scythe Ultra Kaze Sistema: 2 x Yate Loon
Pruebas sintéticas	Futuremark 3DMark Vantage Futuremark 3DMark 11 Futuremark 3DMark (Año 2013) Unigine Heaven HWBot Edition Unigine Valley Extreme HD
Juegos reales y Benchmark tools	Batman: Arkham Origins Battlefield 4 Crysis 3 GRID: Autosport Hitman: Absolution Metro: Last Light Tomb Raider
Sistema operativo y controladores	Microsoft Windows 7 Ultimate 64 bit NVIDIA Geforce 344.11 WHQL

Metodología de pruebas

Para esta sesión de pruebas hemos fijado el sistema a su velocidad de fábrica, entiéndase como procesador, memorias y tarjeta gráfica. Todas y cada una de las pruebas se corrieron un mínimo de 3 veces para evitar corridas falsas y aminorar el rango de error que siempre puede estar presente. Además, se configuró al máximo cada uno de los juegos en el apartado gráfico y filtro. Vale decir que cada configuración de filtros y detalles está expuesta en cada gráfico correspondiente. La tarjeta en cuestión quedará configurada de la siguiente manera durante todas las pruebas:

Benchmark Tool versus Escenas Reales

Hemos agregado títulos nuevos y más actuales a nuestra batería de pruebas, muchos de los cuales no vienen provistos con una propia escena prerenderizada establecida. Entendamos, antes que todo, la diferencia entre ambos: Por un lado tenemos los títulos benchmark tool (Metro Last Light, Hitman, Batman, Tomb Raider, GRID), los cuales son una escena predefinida que entrega un resultado final o un promedio de fotogramas por segundo. Por otro lado, las pruebas de escena real (Crysis 3 y Battlefield 4) son mapas dentro del mismo juego, las que se deben monitorear con el software pertinente para obtener un “mínimo, promedio y máximo” de cada prueba. Siempre se trata de “seguir el mismo camino” dentro de esta escena para no generar variaciones notables al momento de comparar. Dependiendo del punto de vista, un benchmark tool se puede ver poco real al momento de encasillar cierto rendimiento para X pieza a probar, sin embargo, nos sirve como punto de referencia para compartir resultados y experiencias entre todos los usuarios.

La importancia de los FPS

Tanto se habla de la cantidad de FPS (o frames per second; cuadros por segundo), y pocas veces uno se detiene a explicar de la mejor manera posible los valores ideales en cada caso. Acá tenemos 3 diferencias importantes para cada nivel de FPS.

30 FPS

Se supone que una persona normal, común y sin problemas visuales ve por lo general a 30 FPS, osea, ve 30 cuadros por segundo. Si llevamos esto a los juegos quiere decir que si obtenemos por lo menos 30 FPS veremos un juego fluido y jugable. Si bajamos de este rango tendremos los típicos escenarios donde el juego se convierte en una presentación en Power Point, y al fin de cuentas “molesta”.

60 FPS

Un jugador algo más entrenado, acostumbrado y, si se puede decir, más vicioso en el tema, reconocerá automáticamente cuando un juego está funcionando a más de 30 FPS. De hecho, en la mayoría de los títulos este valor es claramente notable: el juego se mueve mucho más suave, agradable a la vista y, dependiendo del motor de juego, hasta más rápida es la sensación.

120 FPS

La llegada de los monitores de 120 Hz y 3D ha puesto a prueba nuevamente al mercado. Básicamente los 120 FPS te aseguran un mínimo de 60 FPS al momento de jugar algo en 3D (recordemos que este sistema se basa en dos imágenes, una parte de los 120 cuadros por segundo para cada ojo). Entonces, si buscas tener una experiencia completa en 3D, los 120 FPS son tu número de lotería.

Consumo

Para calcular el consumo del equipo utilizamos el método del amperímetro y el multitester; El primero de ellos va midiendo una de las fases en el cable de salida hacia la línea energética de nuestro hogar, el segundo mide directamente la tensión en nuestro hogar. Multiplicando ambos factores obtendremos el consumo del equipo, expresado en Watts. Teniendo esto claro, usaremos dos estados de nuestro equipo para determinar los valores: En un principio, dejaremos el equipo en reposo durante 15 minutos para luego tomar cuenta de los valores entregados por las herramientas. Luego de eso, llevaremos cuenta del consumo en todos los benchmarks que utilizamos, para quedarnos con el registro más alto de ellos.

Temperaturas

Siguiendo el proceso anterior aprovechamos de registrar las temperaturas del GPU en cada una de las situaciones descritas en el párrafo de arriba, quedando finalmente como sigue a continuación:

NVIDIA GTX 980: Valores máximos
Benchmark	Frecuencia	Temperatura	% TDP	% RPM
3DMark Vantage	1278,3 MHz	66 °C	82 %	53 %
3DMark 11 Perf.	1278,3 MHz	66 °C	82 %	51 %
3DMark – Fire Strike	1278,3 MHz	68 °C	85 %	55 %
3DMark – Sky Diver	1278,3 MHz	67 °C	84 %	53 %
Unigine Heaven	1278,3 MHz	66°C	82 %	52 %
Unigine Valley	1278,3 MHz	68 °C	85 %	55 %
Batman: Origins	1278,3 MHz	63 °C	80 %	50 %
Battlefield 4	1278,3 MHz	64 °C	80 %	50 %
Crysis 3	1278,3 MHz	67 °C	83 %	54 %
GRID: Autosport	1278,3 MHz	64 °C	81 %	51 %
Hitman: Absolution	1278,3 MHz	67 °C	84 %	54 %
Metro: Last Light	1278,3 MHz	68 °C	85 %	55 %
Tomb Raider	1278,3 MHz	65 °C	81%	51 %

Pruebas sintéticas: 3DMark y Unigine

El concepto de pruebas sintéticas se refiere a programas de uso demostrativo, con el fin de sólo entregar un puntaje en base a una escena pre-renderizada. Nada dentro del ciclo de pruebas es espontáneo, de hecho, cada movimiento, escena y toma viene predefinida. Muchos discuten sobre la veracidad de estos programas, pero actualmente son tan utilizados que se pueden tomar como referencia para comparar plataformas, sean del mismo tipo o con diferentes componentes. En nuestro caso usamos distintas pruebas sintéticas, o benchmarks, que abarcan variados rangos de exigencia y carga para la pieza en cuestión. Así, los programas que se han logrado ganar un puesto en nuestra batería son los 3DMark de Futuremark, junto a los dos mayores exponentes de la desarrolladora Unigine: Heaven y Valley. Todos con características distintas, aunque lo que los une es su gusto por hacer sufrir cuanta tarjeta gráfica se ponga por delante.

3DMark Vantage

3DM-Vantage

3DMark 11

3DM11

3d11_performance

3DMark (año 2013)

3DM-2013

3d13_extreme

Unigine Heaven – HWbot Edition

Unigine-heaven

Unigine Valley

Unigine-valley

valley_extremehd

valley_extremehd_fps El más reciente exponente de Unigine es el nuevo “Valley”; Un hermoso paraje montañoso con unas tomas únicas de bosques y valles, con iluminación dinámica, cambios en el clima y teselación de alto nivel. Una maravilla para deleitar la vista y hacer sufrir VGA’s.

Benchmarks en Juegos

Dejamos atrás los fríos números de las pruebas sintéticas para buscar más acción y suspenso con la llegada de las pruebas reales. Nos referimos a ellas como pruebas reales ya que son juegos conocidos, que cualquier usuario como tu o yo podemos ejecutar en nuestros hogares. El 100% de las veces estas pruebas hacen uso de motores de juegos comerciales, y en algunos de estos casos, estas pruebas son con tintes variables, ya que a pesar de que los caminos están pre-definidos, los movimientos, acciones y reacciones del resto son completamente distintas de una u otra corrida.

Batman: Arkham Origins

Batman

Battlefield 4

Battlefield-4

Crysis 3

Crysis-3

GRID: Autosport

Grid

grid_autosport

Hitman: Absolution

Hitman

hitman_absolution

Metro: Last Light

Metro

metro_ll

Tomb Raider

Tomb-Raider

tomb_raider

Eficiencia: Rendimiento vs consumo energético

Parte importante en la elección de una tarjeta gráfica adecuada y más aún con este competitivo rango de precios, es su nivel de rendimiento por cada unidad de Watt que consuma. Con esto podemos definir una relación de eficiencia energética que va de la mano con el ahorro y, como algunos la conocen, la compra ecológica o amiga del medio ambiente. Para definir este valor separaremos los resultados que claramente no pueden estar definidos en un mismo rango, como los FPS y un simple puntaje. En otras palabras, como todos los juegos que probamos nos entregan su resultado expresado en frames por segundo – FPS -, que mientras más alto es mejor, y los benchmarks nos entregan sus resultados en puntos, separaremos en dos grupos de valores cada expresión. Para determinar este valor, relación, expresión o como quieran llamarle, promediaremos cada grupo de resultados para luego dividirlo por el consumo en Watts. Con esto obtendremos, por así decirlo, la cantidad de cuadros por segundo o puntos, por cada Watts que el sistema consume. Más claro que el agua imposible.

Benchmarks

MODELO	CONSUMO	EFICIENCIA	ESTADO
MSI GTX 980 Gaming 4GB	319 Watts	320,08	Vigente
NVIDIA GTX 980 4GB	309 Watts	320,08	Vigente
MSI GTX 970 Gaming 4GB	285 Watts	319,63	Vigente
ASUS GTX 970 STRIX 4GB	298,6 Watts	307,67	Vigente
ASUS GTX 750 Ti DCUII 2GB	163,5 Watts	298,52	Vigente
NVIDIA GTX 780 Ti 3GB	378,3 Watts	247,66	Vigente
NVIDIA GTX 770 2GB	326,8 Watts	241,01	Vigente
NVIDIA GTX 760 4GB	289,5 Watts	234,18	Vigente
AMD Radeon R7 265 2GB	245,4 Watts	223,46	Vigente
AMD Radeon R9 280X 3GB	372,5 Watts	218,15	Vigente
AMD Radeon R9 290 4GB	429,1 Watts	209,83	Vigente

Juegos

MODELO	CONSUMO	EFICIENCIA	ESTADO
MSI GTX 980 Gaming 4GB	319 Watts	1,812	Vigente
ASUS GTX 970 STRIX 4GB	298,6 Watts	1,806	Vigente
NVIDIA GTX 980 4GB	309 Watts	1,796	Vigente
MSI GTX 970 Gaming 4GB	285 Watts	1,755	Vigente
NVIDIA GTX 780 Ti 3GB	378,3 Watts	1,539	Vigente
NVIDIA GTX 770 2GB	326,8 Watts	1,362	Vigente
AMD Radeon R9 290 4GB	429,1 Watts	1,245	Vigente
ASUS GTX 750 Ti DCUII 2GB	163,5 Watts	1,195	Vigente
NVIDIA GTX 760 4GB	289,5 Watts	1,151	Vigente
AMD Radeon R9 280X 3GB	372,5 Watts	1,141	Vigente
AMD Radeon R7 265 2GB	245,4 Watts	0,936	Vigente

Eficiencia: Rendimiento vs Precio de mercado

Parte de una buena inversión es adquirir una tarjeta que rinde por cada peso que estamos pagando. La siguiente tabla pretende hacernos una idea general de toda la gama de tarjetas gráficas que hemos probado.

Rendimiento vs Precio: Benchmarks

Precio actualizado 19-09-2014 en Newegg.com

MODELO	PRECIO	EFICIENCIA	ESTADO
AMD Radeon R7 265 2GB	149 USD	223,46	Vigente
ASUS GTX 750 Ti DCUII 2GB	149 USD	298,52	Vigente
NVIDIA GTX 760 4GB	249 USD	234,18	Vigente
AMD Radeon R9 280X 3GB	299 USD	218,15	Vigente
ASUS GTX 970 STRIX 4GB	339 USD	307,67	Vigente
MSI GTX 970 Gaming 4GB	349 USD	319,63	Vigente
NVIDIA GTX 770 2GB	329 USD	241,01	Vigente
AMD Radeon R9 290 4GB	399 USD	209,83	Vigente
NVIDIA GTX 780 Ti 3GB	599 USD	247,66	Vigente
NVIDIA GTX 980 4GB	549 USD	179,27	Vigente
MSI GTX 980 Gaming 4GB	579 USD	176,35	Vigente

Rendimiento vs Precio: Juegos

Precio actualizado 19-09-2014 en Newegg.com

MODELO	PRECIO	EFICIENCIA	ESTADO
ASUS GTX 970 STRIX 4GB	339 USD	1,59	Vigente
AMD Radeon R7 265 2GB	149 USD	1,54	Vigente
MSI GTX 970 Gaming 4GB	349 USD	1,43	Vigente
AMD Radeon R9 280X 3GB	299 USD	1,42	Vigente
NVIDIA GTX 770 2GB	329 USD	1,35	Vigente
AMD Radeon R9 290 4GB	399 USD	1,34	Vigente
NVIDIA GTX 760 4GB	249 USD	1,34	Vigente
ASUS GTX 750 Ti DCUII 2GB	149 USD	1,31	Vigente
NVIDIA GTX 980 4GB	549 USD	1,01	Vigente
MSI GTX 980 Gaming 4GB	579 USD	1,0	Vigente
NVIDIA GTX 780 Ti 3GB	599 USD	0,97	Vigente

Conclusiones

La GeForce GTX 980 es sin duda la mejor tarjeta tope de línea de diseño referencial que se ha lanzado en bastante tiempo. NVIDIA ha solucionado con éxito el desafío mas importante en el diseño actual de GPUs, el consumo energético.

En términos de desempeño, encontramos que la GTX 980 supera a la GTX 780 Ti, ya que teniendo menos núcleos CUDA, menos unidades de textura, casi 2000 millones de transistores menos y cerca de un 50% menos en el TDP, el GM204 se desempeña casi idénticamente que el GK110. Esto también nos indica de que el GM204 no será el chip más grande que NVIDIA piensa diseñar para esta arquitectura, así que podemos prepararnos para que el próximo año aparezca algún refresco de este GPU.

Cuando miramos desempeño, tenemos que mirar el consumo energético. En estos días, el consumo de energía es el factor que limita el desempeño de los GPUs ya que el calor y el ruido son lo que vienen a consecuencia de ello. Aparte, no se puede disipar mucho calor en una tarjeta gráfica y mantenerla silenciosa al mismo tiempo. La primera vez que vimos el gran avance en la eficiencia energética de Maxwell fue con la GTX 750Ti y ahora podemos ver que NVIDIA ha logrado llevar esas mejoras a su producto tope de línea. La GTX 980 utilizó en promedio unos 153W de la plataforma en nuestras pruebas, lo cual es algo increíblemente bajo para una tarjeta con este desempeño. Ahora, si miramos la competencia, AMD con el GPU Tonga consume 50W mas por casi la mitad del desempeño de Maxwell.

Otra de las cosas que NVIDIA ha mejorado es el consumo de energía en momentos de reposo o cuando no se está jugando, lo cual es algo importante para usuarios que no juegan todo el día, pero si trabajan con sus máquinas y que pasan largos periodos de tiempo en reposo.

Ahora, hablaremos de precios. la GeForce GTX 980 se venderá en el retail en alrededor de 550U$. Viendo el pasado de NVIDIA, el precio esta dentro del margen razonable y quizá algo mas bajo de lo que esperábamos. En este segmento de precios la GTX 980 le gana a la Radeon R9 290X en todo: Precio/rendimiento, Rendimiento Absoluto, Rendimiento por watt, consumo energético, calor y ruido.

En los próximos días, llegaran a las tiendas las GTX 980 y varios fabricantes ya tienen listos sus modelos no referenciales y varios de ellos estarán aquí en Ozeros. Así que a estar atentos por que se viene bueno.

En resumen, la GTX 980 es una maravilla en desempeño. Realmente NVIDIA hizo el trabajo como correspondía y nos sorprendió de una grata forma con una tarjeta tope de línea que rinde lo que promete. Es por esto que le otorgamos los premios de Producto Recomendado y Rendimiento Máximo.

Y antes de cerrar esta revisión, no olvides seguirnos en las redes sociales de Facebook y Twitter, donde los mantendremos al día de los hechos noticiosos y podrán saber detalles exclusivos de la llegada de nuevas piezas de reviews, récords de overclock, tips, resolución de dudas, etc.

Review: Tarjeta Gráfica NVIDIA Geforce GTX 980 4GB. La nueva joya de rendimiento y eficiencia

Corporativo

Contenido

Review: Tarjeta Gráfica NVIDIA Geforce GTX 980 4GB. La nueva joya de rendimiento y eficiencia

Review: Tarjeta Gráfica NVIDIA Geforce GTX 980 4GB. La nueva joya de rendimiento y eficiencia

Arquitectura Maxwell

GM204 y el overclock

Las nuevas GTX 980 y GTX970

NVIDIA GeForce GTX 980 Frente a la Cámara

NVIDIA GeForce GTX 980 en Profundidad

Plataforma de pruebas

Metodología de pruebas

Benchmark Tool versus Escenas Reales

La importancia de los FPS

30 FPS

60 FPS

120 FPS

Consumo

Temperaturas

Pruebas sintéticas: 3DMark y Unigine

3DMark Vantage

3DMark 11

3DMark (año 2013)

Unigine Heaven – HWbot Edition

Unigine Valley

Benchmarks en Juegos

Batman: Arkham Origins

Battlefield 4

Crysis 3

GRID: Autosport

Hitman: Absolution

Metro: Last Light

Tomb Raider

Eficiencia: Rendimiento vs consumo energético

Benchmarks

Juegos

Eficiencia: Rendimiento vs Precio de mercado

Rendimiento vs Precio: Benchmarks

Rendimiento vs Precio: Juegos

Conclusiones

CES14: Project CARS junto a 4 way SLI GTX TITAN a 12K

Battlefield 4: PC vs Xbox One vs PlayStation 4 en video

Corporativo

Contenido