¿Puede una GPU de cuatro teraflops cortarlo para una consola de próxima generación? • Eurogamer.net

¿Puede una GPU de cuatro teraflops cortarlo para una consola de próxima generación? • Eurogamer.net

¿Una consola de próxima generación con solo 4 teraflops de potencia de GPU? Bueno, ese es el rumor. Si bien Microsoft se burla y nos tienta con el gigante de 12TF que es Xbox Series X, persisten los rumores de que se está desarrollando una segunda caja, diseñada para llegar al mercado a un precio mucho más bajo, socavando PlayStation 5 y aún siendo capaz de jugar cada uno. todos los juegos de Xbox de próxima generación. Lockhart es su nombre en clave y el concepto básico detrás de su creación me parece absolutamente fascinante.

Si bien sospecho que hay importantes matices en el diseño que aún no se han revelado, es seguro asumir que la premisa básica se basa en la teoría de que los gráficos son mucho más escalables que cualquier otro componente de un juego en particular, con la idea de que La serie X apunta a 4K, mientras que Lockhart apunta a 1440p. Esto se ve confirmado por las diversas filtraciones de especificaciones que hemos visto, que pintan una imagen de una consola que tiene muchos más puntos en común con la Serie X que las diferencias. Las fugas sugieren que Lockhart tiene el mismo clúster de CPU de ocho núcleos / 16 hilos que la Serie X (los relojes de la CPU pueden ser muy diferentes) mientras que todavía utiliza una solución de almacenamiento de estado sólido basada en NVMe. Como está diseñado para ejecutarse a resoluciones nativas más bajas que la Serie X, también deberíamos esperar una menor provisión de memoria GDDR6: parece probable que 12GB frente a los 16GB de la máquina más capaz.

Sin embargo, es la GPU reducida la que presenta el mayor desafío de marketing para Microsoft. En un mundo donde Xbox One X llegó al mercado con seis teraflops en 2017, ¿cómo puede una máquina 4TF reducirlo para la próxima generación? Sospecho que todo se trata de una combinación de mejoras arquitectónicas Navi de AMD que ven mucho más ‘rendimiento para su teraflop’, probablemente combinado con características de GPU más modernas que las arquitecturas actuales de la consola GCN simplemente no tienen. El lado arquitectónico de la ecuación ya es una cuestión de registro. En octubre del año pasado, armamos una compilación AMD con 9.2 teraflops de potencia de GPU Navi y descubrimos que obtuvimos más del 80 por ciento de rendimiento con solo un 53 por ciento más de cómputo.

Un video de Digital Foundry donde puedes ver todo este trabajo de elaboración de teoría y evaluación comparativa ante tus propios ojos.

Pensé que sería interesante ver cómo se ajustarían los resultados si esta vez apilamos una tarjeta gráfica Navi de aproximadamente cuatro teraflops contra Xbox One X y productos GCN basados ​​en PC sintonizados para ofrecer 6TF de rendimiento informático. Utilicé una Radeon RX 5500 XT, descargada de su 4.8TF basado en el reloj de la vida real a alrededor de 4.3TF. El RX 5500 XT presenta 22 unidades de cómputo activas de un total de 24, y mi intuición (¡y nada más!) Es que una máquina Lockhart real probablemente presentaría mayores velocidades de reloj y menos CU, lo que requeriría un ligero reequilibrio por parte de mi PC sustituta .

Incluso entonces, creo que nuestra GPU basada en Navi puede estar por debajo de una posible especificación de Lockhart. El RX 5500 XT solo tiene una interfaz de 128 bits con 224 GB / s de ancho de banda de memoria conectado a cuatro u ocho gigabytes de GDDR6. Si Lockhart se entrega con 12 GB de memoria, la solución más rentable es probablemente un bus de 192 bits, con algo en la región de 288 GB / s de ancho de banda.

Aquí hay muchas conjeturas, pero la primera pregunta que quería abordar era si una solución Navi de alrededor de 4TF podría competir con las partes GCN de 6TF. Xbox One X fue un punto de comparación obvio, pero también arrojé una RX 590 con un reloj no sincronizado y una R9 390 con reloj en exceso, que De Verdad no me gustaba ser empujado a 1172MHz, pero era lo suficientemente estable para nuestros resultados. Hay muchas variables en nuestras pruebas aquí, por lo que esta tabla debería resumir todo, y sí, mientras que el RX 590 estaba subclockeado, aceleré la memoria ya que 288GB / s parece un buen ajuste para Lockhart y el 590 podría acomodar fácilmente esta. También he incluido un Radeon RX 5700 XT sintonizado basado en Navi que entrega 9.2 teraflops de cómputo, un estadio equivalente a las especificaciones filtradas de PS5.

READ  Verificando los hechos: el CEO de Hilton junto a él rompe la teoría de la conspiración de Trump
Radeon RX 5500 XT sintonizadoRadeon RX 5700 XT sintonizadoRadeon RX 590 TunedRadeon R9 390 sintonizadoXbox One X
Calcular unidades2240364040
GPU Compute Power4.3TF9.2TF6.0TF6.0TF6.0TF
Reloj de núcleo1550MHz1800MHz1310MHz1172MHz1172MHz
interfaz de memoria128 bits256 bits256 bits512 bits384 bits
ancho de banda de memoria224GB / s448GB / s288GB / s384GB / s326GB / s
Tamaño de la matriz158mm2251mm2232mm2438mm2360mm2
ProcesoTSMC de 7 nmTSMC de 7 nmFundiciones globales de 12 / 14nm28nm TSMC16nmFF TSMC
Fecha de lanzamiento de silicio20192019201620132017

Con todo nuestro posible hardware alineado, comencemos con un punto de comparación que presenta la mayor cantidad posible de nuestro kit. Pero antes que nada, subrayemos que no se supone que sean pruebas de juego de próxima generación: debemos esperar que la utilización de GPU cambie significativamente en la próxima ola de juegos. Lo que estamos tratando de hacer aquí es probar las GPU con cargas de trabajo similares y sensatas. Con ese fin, Io Interactive compartió con nosotros su configuración de calidad equivalente para PC para la versión Xbox One X de Hitman 2, que funciona con una resolución de 2160p. Comparé todas nuestras GPU 6.0TF y el Navi de gama baja en resoluciones de 1080p, 1440p y 2160p, y también incluí el resultado UHD de nuestro RX 5700 XT sintonizado. Como puede ver en los puntos de referencia a continuación, aquí hay algunos resultados interesantes.

La conclusión más importante es que el 4.3TF Navi es capaz de superar a todas las tarjetas GCN 6.0TF contra las que lo apilé, a pesar de su aparente falta de potencia de cómputo sin procesar y su enorme desventaja de ancho de banda de memoria contra cualquier otro competidor en el campo. Obviamente, no es una victoria completa, pero creo que a pesar de mis mejores intentos de equilibrar el RX 5500 XT, el ancho de banda es probablemente demasiado bajo, y desafortunadamente, por razones que no entiendo, a las GPU Navi de AMD realmente no les gusta tener sus módulos GDDR6 overclockeados, por lo que no hay mucho que pueda hacer para corregir el equilibrio.

Curiosamente, Xbox One X en 2160p tiene una ventaja pequeña pero significativa sobre nuestro Navi de gama baja sintonizado, pero lo que encuentro especialmente fascinante es cómo la escalabilidad se compara con el Radeon RX 5700 XT sintonizado con 9.2TF. Con una ventaja informática de 2.2x, la tarjeta Navi de gama alta ofrece un 92 por ciento adicional de rendimiento. Según tengo entendido, se supone que Lockhart debe entregar a 1440p lo que ofrece Xbox Series X a 4K, pero según la escalabilidad que se ve aquí, la resolución debería ser menor para lograr esto, tal vez en algún punto medio entre 1080p y 1440p. Esto podría funcionar: el 4.3TF Navi a 1080p todavía tiene una ventaja del 30% sobre el 9.2TF Navi a 4K.

Hitman 2: Configuración de la consola / TAA

  • RX 5500 XT 4.3TF
  • RX 590 6.0TF
  • R9 390 6.0TF
  • RX 5500 XT 4.3TF
  • RX 590 6.0TF
  • R9 390 6.0TF
  • RX 5500 XT 4.3TF
  • RX 590 6.0TF
  • R9 390 6.0TF
  • Xbox One X [V-Sync]
  • RX 5700 XT 9.2TF

Pasando a nuestro próximo caso de prueba, estamos bastante seguros de que los juegos id Tech 6 en las consolas son equivalentes a las versiones de PC que se ejecutan en configuraciones medias (y debemos enfatizar que todavía se ven genial, incluso si no estamos corriendo a alta o ultra). Una vez más, podemos tener en cuenta que Xbox One X ejecuta el mismo contenido y, de hecho, nuestro Radeon RX 5700 XT sintonizado a 9.2TF a 2160p.

Hay resultados similares en general aquí a lo que experimentamos en Hitman 2, aunque el RX 5500 XT pierde su ventaja de rendimiento de 1080p contra sus rivales 6.0TF basados ​​en GCN a medida que escalamos la escala de resolución. Una vez más, Xbox One X tiene una ventaja de rendimiento similar a 2160p, al igual que Hitman 2. Y nuevamente, tengo que preguntarme si el ancho de banda de memoria limitado puede ser el problema aquí.

También se observan resultados similares a Hitman 2 cuando analizamos la escalabilidad entre nuestras dos partes Navi sintonizadas. En este escenario, la ventaja de cálculo 2.2x que posee el 9.2TF RX 5700 XT se traduce en un aumento del rendimiento del 93%. Sin embargo, esta vez, con una resolución de 1440p, nuestro 4.3TF RX 5500 XT ejecuta el mismo contenido más rápido que el 5700 XT que se ejecuta a 4K, mientras que el rendimiento delta a 1080p frente a 2160p es francamente masivo. Parece que los diferentes motores de juego se escalan de diferentes maneras en la escala de resolución, pero al observar cuán rápido es el 5500 XT a resoluciones más bajas, comienzas a preguntarte si una consola de resolución más baja en realidad podría pagar dividendos.

Wolfenstein – The New Colossus: Medium, TSSAA

  • RX 5500 XT 4.3TF
  • RX 590 6.0TF
  • R9 390 6.0TF
  • RX 5500 XT 4.3TF
  • RX 590 6.0TF
  • R9 390 6.0TF
  • RX 5500 XT 4.3TF
  • RX 590 6.0TF
  • R9 390 6.0TF
  • Xbox One X [V-Sync]
  • RX 5700 XT 9.2TF

Nuestro punto de referencia final en el análisis principal aquí se centra en el Control de remedios, lo que demuestra que hay algunas cargas de trabajo en las que el tipo de escalabilidad que hemos visto en pruebas anteriores simplemente no se traduce. Frente a las tarjetas 6.0TF GCN, nuestro Radeon RX 5500XT sintonizado 4.3TF se queda dramáticamente corto en términos de rendimiento. Es especialmente sorprendente que el relativamente antiguo R9 390 con sede en Hawai logre funcionar tan bien como lo hace en cualquiera de estas pruebas, considerando que en todos los casos estamos utilizando API de gráficos modernos: DX12 y Vulkan. Hemos visto anteriormente que las tarjetas GCN de primera generación basadas en el diseño de Tahití parecen exhibir un rendimiento realmente pobre en algunos títulos DX12, pero la R9 390 se mantiene muy bien en casi todas nuestras pruebas. Y para verlo mejor, el RX 5500 XT ajustado cuando ha funcionado tan bien en otros lugares sigue siendo un misterio.

Dicho esto, sin embargo, la escalabilidad en las tarjetas Navi sigue siendo relativamente constante. De hecho, el RX 5500 XT a 1440p es punto por punto idéntico en términos de rendimiento al 9.2TF RX 5700 XT que funciona a 2160p, con una ventaja de velocidad de fotogramas enormemente predecible en resolución Full HD. En el papel, el concepto de cualquier soporte de plataforma que lanza una consola de cuatro teraflop para juegos de próxima generación parece casi absurdo, pero los números aquí siguen sugiriendo que la idea de reducir la resolución, y solo la resolución, podría dar sus frutos.

En el caso de Control, pude empujar aún más frecuencia a través del RX 5700 XT, llevando el rendimiento de cómputo hasta 10.2TF. Tenía curiosidad acerca de esto porque algunos han sugerido que Sony puede apuntar a este número para obtener el nivel máximo absoluto de rendimiento posible de un chip con un potencial de 40 unidades de cómputo totalmente habilitadas. Digamos que la RX 5500 XT no estaba particularmente contenta de hacer esto y la mejora del rendimiento simplemente no valía la pena el esfuerzo: un 11 por ciento adicional de cómputo obtuvo solo el 6.5 por ciento del rendimiento real y la ventaja de la velocidad de fotogramas sobre El RX 5500 XT ajustado a 4.3TF que funciona a 1440p es solo un 5.3 por ciento.

Control: Medio, TAA

  • RX 5500 XT 4.3TF
  • RX 590 6.0TF
  • R9 390 6.0TF
  • RX 5500 XT 4.3TF
  • RX 590 6.0TF
  • R9 390 6.0TF
  • RX 5500 XT 4.3TF
  • RX 590 6.0TF
  • R9 390 6.0TF
  • RX 5700 XT 9.2TF
  • RX 5700 XT 10.2TF

Como verá en el video incrustado en la parte superior de la página, y de hecho en el rango de puntos de referencia adicionales que encontrará escondido en la página dos de este artículo, nuestro ejercicio de escalabilidad en la arquitectura Navi produce resultados ampliamente consistentes. Mientras que el rendimiento delta entre 1440p en un Navi de gama baja y 2160p en un equivalente de gama alta varía según el título, los números sugieren que una consola de cuatro teraflop podría funcionar. Sin embargo, lo que está claro es que una futura consola Lockhart a 1440p ofrecería resultados mucho más cercanos a una noción 9.2TF PlayStation 5, con la 12TF Xbox Series X quizás demasiado poderosa en comparación. Pero tal vez ese sea el punto: si miramos la estrategia más amplia de Microsoft, un producto spoiler contra PlayStation 5 tiene mucho más sentido que tratar de robar ventas de Xbox Series X.

Sin embargo, también debemos tener en cuenta que todavía hay mucho no sabemos acerca de la próxima generación de consolas: los “matices importantes” en el diseño al que me referí anteriormente. En primer lugar, ahora tenemos una confirmación explícita de RDNA 2 como base de la arquitectura. Además de las características de trazado de rayos aceleradas por hardware y VRS (sombreado de velocidad variable), ¿de qué otra manera ha evolucionado la arquitectura en comparación con las partes de PC que hemos probado aquí? La verdad es que simplemente no lo sabemos. Además de eso, también existe la noción de la consola clásica ‘salsa secreta’, o más específicamente, las personalizaciones a nivel de hardware que los titulares de la plataforma incorporan en sus diseños.

Además de eso, existe la idea básica de que nos estamos moviendo rápidamente a lo que podríamos llamar la era posterior a la resolución, como lo discutió mi colega John Linneman en su análisis de Metro Redux en Switch, donde demostró que una imagen de 720p de Switch ofrece una calidad de imagen mucho más alta que una imagen de 720p del mismo juego que se ejecuta en las consolas de última generación. Switch es un ejemplo fascinante de cuán escalables son los gráficos, por supuesto, con Metro uno de los ejemplos más convincentes de cómo un juego puede conservar su identidad visual a pesar de ejecutarse en una GPU mucho menos capaz.

directml
Microsoft ha experimentado con la mejora de la IA a través de DirectML utilizando Forza Horizon 3 para las pruebas.

Finalmente, las técnicas de reconstrucción de imágenes están mejorando en calidad hasta el punto en que la ampliación de la escala DLSS AI de Nvidia ahora es capaz de producir resultados enormemente impresionantes de solo una cuarta parte de la resolución nativa, y en realidad tenemos un ejemplo de algunas investigaciones de Microsoft en las que la empresa está utilizando su propia máquina API basada en el aprendizaje, DirectML, para producir algunos notablemente buenos Intensificación de AI en Forza Horizon 3. Hasta ahora, no hemos tenido ningún tipo de pistas sobre las funciones de aprendizaje profundo aceleradas por hardware integradas en las consolas de última generación o incluso en RDNA 2, pero DirectML ha sido diseñado en paralelo con la API de trazado de rayos DXR y me resulta difícil creer que Microsoft desarrollaría esta tecnología cuando solo Nvidia tiene el hardware para aprovecharla por completo.

Teniendo en cuenta los avances en la tecnología GPU, la reducción de la resolución nativa como una indicación principal de la calidad general de la imagen y los ejemplos ultra extremos de escalabilidad de gráficos presenciados en Switch, hay un argumento de que las estrellas se están alineando para que Lockhart entregue una entrada consola de nivel que realmente podría funcionar. Los precios serán críticos, porque solo se ahorrará mucho dinero con un procesador más pequeño y menos RAM y si, por ejemplo, PS5 llega al mercado con alrededor del doble de rendimiento y cuesta solo entre $ 100 y $ 150 más, Lockhart puede tener dificultades para ganar el argumento . De hecho, si la economía no funciona, tal vez la máquina nunca se lanzará en absoluto.

También es justo decir que comercializar tal máquina también será un desafío considerable. Realmente pensé que los titulares de la plataforma evitarían los teraflops como una métrica de rendimiento para la nueva ola de máquinas simplemente porque el concepto de un teraflop Navi tiene poca relación con un teraflop GCN de última generación: cada prueba muestra que Navi es mucho más capaz . A pesar de esto, sin embargo, Microsoft ha seguido directamente con 12TF como un mensaje clave de marketing para Xbox Series X, que seguramente no puede reflejarse favorablemente en la máquina más barata.

Pero quizás la mayor preocupación con la idea de una máquina como esta es que cualquier tipo de línea de base tecnológica más baja puede limitar a los desarrolladores en la arquitectura de experiencias de próxima generación, y como hemos visto con la generación actual, la memoria reducida y la potencia de los gráficos han hecho un impacto (a veces bastante profundo) en ciertos títulos que se ejecutan en Xbox One S y PlayStation 4 Pro. Sin embargo, si bien las pruebas aquí solo pueden considerarse realmente una aproximación aproximada muy aproximada de lo que puede ofrecer lo real, el concepto básico de escalabilidad parece comprobarse, y con la fijación de precios de próxima generación aparentemente preocupante, tal vez un valor más orientado consola es lo que el mercado va a necesitar.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *