viernes, 24 de septiembre de 2010

AMD: Bulldozer (parte I)

Bulldozer es la nueva microarquitectura de AMD, en realidad es la primera microarquitectura hecha desde cero desde los tiempos del extitoso K8, Athlon 64 y Athlon 64 X2, cuando AMD fue capaz de doblegar a los Intel Pentium 4 de la época, introduciendo conceptos como el multi núcleo o los estados de bajo consumo/frecuencia en procesadores de sobremesa.

Se empiezan a saber algunas cosas sobre Bulldozer, aunque el rendimiento que podemos esperar de este sigue siendo un tanto difuso.

Situación actual CPU AMD en el sector doméstico

Si reflexionamos sobre la actual situación de las CPU de AMD, veremos que desde el punto de vista arquitectónico no se encuentran en una situación nada fácil.

Los actuales Phenom II de 4 y 6 núcleos (nombres clave respectivos Deneb y Thuban) a la misma frecuencia y con igual número de núcleos no son sólo más lentos que los actuales Intel Core i7 e i5, sino que también lo son respecto de la anterior generación Core 2 Duo y Quad.

Sin embargo no todo son malas noticias: los Phenom II de gama alta son más potentes que el más rápido de los Core 2 Quad y que muchos de los Core i5 e incluso algunos Core i7 con un precio igual o inferior. Esto es debido a las constantes mejoras que AMD ha ido introduciendo tanto en el proceso de fabricación como en la microarquitectura de los Phenom II.

Esto hace que los Phenom II, a igualdad de rango de precio, dispongan de mayor frecuencia o mayor número de núcleos, lo que se traduce en unas prestaciones iguales o superiores frente a los procesadores de Intel.

Lo que AMD no puede hacer es competir en prestaciones en la gama alta de precios: los i7 8XX y 9XX son inalcanzables, en general, en prestaciones para los Phenom II. Esto se traduce en que los procesadores de AMD son competitivos hasta la franja de los 240-250€, donde se posicionan los Phenom II X6 (de seis núcleos) y los Intel i7 920 y 930 de 4 núcleos: más allá de estos precios sólo hay procesdores Intel, al menos a un nivel doméstico.

AMD dispone además de la gama de procesadores Athlon II, que son básicamente Phenom II sin memoria caché de nivel 3, que en la franja de precios de hasta 100-115€ son ultracompetitivos frente a Intel, gracias a ofrecer CPUs de 3 y 4 núcleos con un rendimiento destacable muy económicas.

Situación actual CPU AMD en el sector empresarial

En el sector de los servidores, a nivel teórico de prestaciones la diferencia sigue siendo abismal, pero parece que en la práctica (o en ventas) no es tan grande. Tenemos procesadores AMD Opteron de hasta 8 o 12 núcleos (no son procesadores monolíticos ya que lo 8 o 12 núcleos se dividen físicamente en 2 bloques de 4 y 6 respectivamente, que se encuentran en la misma pieza de sustrato pero no en un único bloque), frente a los mejores Intel Xeon (familia Nehalem-EX) de la serie 7500 que cuentan con 8 núcleos y 16 threads (2 threads o flujos de control/programa por núcleo), que se convertirán en 10 núcleos y 20 threads en el Q1 de 2011 con la siguiente generación de Xeon (nombre clave Westmere-Ex).

Los AMD Opteron de 8 y 12 núcleos utilizan frecuencias más bajas que sus hermanos de 4 y 6 núcleos para mantener el consumo controlado y la compatibilidad del socket G34 (nombre clave Maranello, sí, el pueblo donde se ubica la fábrica de Ferrari) con anteriores CPU. Como a nivel doméstico, la clave de AMD sigue siendo la relación prestaciones/precio, de manera que ha posicionado sus productos a precio adecuado en función de sus prestaciones, lo cuál le permite ser competitiva respecto de los productos de Intel.

Además se da el caso de que hay escenarios en los cuáles es más importante disponer de mayor número de núcleos frente a una potencia de cálculo superior por núcleo. Esto es así por ejemplo en servidores web, que pueden realizar tareas relativamente ligeras, o cuando queremos consolidar servidores físicos en servidores virtuales: al disponer de más núcleos físicos podemos virtualizar un mayor número de sistemas asignándoles un núcleo físico propio a cada uno de ellos.

Procesadores corto y medio plazo

El problema de la situación actual de AMD es que su precio medio de venta o ASP (del inglés Average Selling Prize) resulta bajo y, en consecuencia, aunque vendan bastantes unidades de los diferentes procesadores los beneficios son bajos.

Bulldozer debe ser el punto de inflexión, la generación de procesadores que devuelva la competitividad a AMD en todos los rangos de precio. La tarea no es nada fácil como hemos visto, pero tanto AMD como la industria necesitan que sea un éxito. La primera porque su situación económica lo exige y, la segunda, porque sin competencia el ritmo de desarrollo y evolución se ralentiza: Intel podría fabricar procesadores más rápidos (con mayores frecuencias principalmente) pero en gran parte no lo hace porque no lo necesita, no hay nadie que les empuje a ello.

Además Bulldozer debe ser la primera generación de procesadores basados en Fusion: el concepto es fusionar las CPUs tradicionales conocidas hasta ahora con las GPUs, de manera que se integren en futuros procesadores pero no sólo eso. Al contrario que Intel, AMD pretende despojar a la CPU de la obligación de realizar cálculos en coma flotante: de eso se encargará la GPU del propio procesador que estará optimizada para ello.

Como resultado futuros procesadores tendrán dos componentes conceptuales pero integrados físicamente en una sola pieza de silicio:
  • la CPU, que realizará cálculos sobre enteros y controlará el flujo de ejecución de los programas como hasta ahora;
  • la GPU, la cuál realizará los cálculos en coma flotante que lleguen al procesador, ya que estará especializada en esto.
Esto además permitirá acelerar la aparición de nuevos procesadores ya que el ciclo de desarrollo de las GPUs, al menos hasta ahora, ha sido más corto que el de las CPUs ,lo cuál podría permitir ofrecer una nueva versión de un procesador con la misma CPU pero con una GPU evolucionada.

Por el bien de todos confiemos en que AMD acierte esta vez y pueda plantar cara o incluso superar de nuevo a Intel.

Alberto Sánchez González (imrbadguy)

jueves, 23 de septiembre de 2010

Xarcom Smith?

Algo está sucediendo dentro de nuestro equipo. Ha llegado un nuevo miembro que está cambiando el status quo establecido hasta ahora.

Su nombre es Xarcom y representa a una empresa que ofrece servicios informáticos, podéis acceder a su página web desde su enlace en la sección "páginas de miembros del equipo".

Xarcom

Date of last work unit 2010-09-23 02:09:50
Total score 57502
Overall rank (if points are combined) 114166 of 1460288
Active clients (within 50 days) 34
Active clients (within 7 days) 32


Su rendimiento está siendo muy elevado: en ningún otro usuario del equipo hemos visto nunca tal crecimiento en el número de clientes, como si fuera el agente Smith en "The Matrix Revolutions" se está multiplicando y extendiendo por todo el sistema.

Esperemos que haya llegado para quedarse y que su rendimiento sea tan elevado como constante.

Alberto Sánchez González (imrbadguy)

miércoles, 15 de septiembre de 2010

INTEL: Sandy Bridge

Sandy Bridge es la nueva arquitectura de Intel, la evolución de las contrastadas Nehalem y Westmere. Desde hace pocos años, Intel sigue la política de Tic-Toc en el lanzamiento de procesadores:
  • Tic: cada nueva generación de procesadores es seguida al año siguiente por un refinamiento sin grandes cambios (por ejemplo Westmere es el Tic respecto de Nehalem).
  • Toc: una vez ha salido el refinamiento, al año siguiente aparece la nueva arquitectura (Sandy Bridge es el Toc respecto de Westmere).

Novedades arquitectónicas

Se empieza a saber bastante de Sandy Bridge, tanto arquitectónicamente como de los productos que aparecerán a finales de este Q4 en el mercado. El objetivo de Intel es el actual del mercado: ofrecer productos más rápidos a la par que eficientes, de manera que se mejore la relación entre prestaciones y consumo (performance per watt).

Arquitectónicamente lo podemos resumir de la siguiente manera:

  • Intel AVX: nuevo juegode instrucciones para ejecutar operaciones sobre vectores con tamaño de palabra de 256 bits, permitirá realizar operaciones de manera más rápida y eficiente.
  • Mejora en la GPU: la GPU estará ahora integrada junto con el procesador de manera que serán una única pieza de silicio (hasta ahora los procesadores de Intel que aunaban CPU y GPU lo hacían como dos componentes diferentes dispuestos en el mismo substrato), se ha mejorado su rendimiento y es compatible con Direct X 10.1 pero no 11, con capacidad para decodificar formatos de vídeo de alta definición.
  • Interconexión interna mediante un bus en forma de anillo: elementos como la CPU, la GPU y la LLC (Last Level Cache, la hasta ahora denominada caché de nivel 3) estarán conectados mediante un anillo de alta velocidad que permitirá que por ejemplo la CPU y la GPU compartan datos en la caché de nivel 3.
  • Estructura modular: la flexibilidad en su diseño permitirá que desde un principio haya variantes de 2 y 4 núcleos para el mercado de sobremesa y portátil, permitiendo además múltiples configuraciones con mayor número de núcleos o GPUs más complejas.
  • Mejora en el branch predictor, cálculo de los "saltos" que el código de un programa va a dar en función de las instrucciones condicionales que se ejecuten: los condicionales (instrucciones if, switch, while, etc.) provocan que unas instrucciones se ejecuten y otras no en función de valores calculados, con lo cuál se producen saltos respecto de la ejecución secuencial del código de un programa.
  • Mejoras en el controlador de memoria y en las unidades de cálculo en coma flotante: mayor velocidad y control en el consumo de energía.
  • Nuevo socket 1155: necesitarán un nuevo socket con los chipsets H67 y P67.
Además dispondrá también de Turbo para aumentar la frecuencia tanto de uno o más núcleos como de la GPU, en función de la carga de trabajo y el consumo energético, y de HyperThreading por lo que cada núcleo podrá ejecutar 2 threads simultáneos.


Modelos iniciales

Estos son los modelos que supuestamente aparecerán al menos al principio, de nuevo los modelos se agruparán en Core i3, Core i5 y Core i7, vendiendo estos como la segunda generación de la arquitectura Core iX.

Sandy Bridge CPU

Frecuencia Base
Caché
L3
Núcleos/
Threads
Máx Frecuencia
1 Núcleo
Turbo
GPU Frecuencia
Base/Turbo
TDP
Intel Core i7 2600K 3.4GHz 8MB 4 / 8 3.8GHz 850 / 1350MHz 95W
Intel Core i7 2600 3.4GHz 8MB 4 / 8 3.8GHz 850 / 1350MHz 95W
Intel Core i5 2500K 3.3GHz 6MB 4 / 4 3.7GHz 850 / 1100MHz 95W
Intel Core i5 2500 3.3GHz 6MB 4 / 4 3.7GHz 850 / 1100MHz 95W
Intel Core i5 2400 3.1GHz 6MB 4 / 4 3.4GHz 850 / 1100MHz 95W
Intel Core i3 2120 3.3GHz 3MB 2 / 4 N/A 850 / 1100MHz 65W
Intel Core i3 2100 3.1GHz 3MB 2 / 4 N/A 850 / 1100MHz 65W


Como vemos el consumo máximo se limitará a los 95W, como en los actuales Core i3, i5 e i7 domésticos. Los modelos acabados en K llevan el multiplicador desbloqueado para facilitar el overclocking.


Posicionamiento en el mercado

Varios factores nos indican que los próximos procesadores se posicionan en la gama mainstream de Intel, es decir, están orientados al mercado masivo en la gama media-alta de prestaciones. Factores que indican esto:
  • 2 canales de memoria: los i7 de socket 1366 disponen de 3 canales de memoria (2 los de socket 1156), lo cuál les permite disfrutar de mayor ancho de banda, aunque dadas las velocidades de la DDR3 actual tampoco es una gran diferencia a nivel doméstico.
  • Canal PCI Express 2.0 de 16X vías: cuando conectamos una tarjeta gráfica moderna estamos utilizando el puerto PCI Express, en función del rendimiento de la tarjeta esta necesitará 8 o 16 vías para utilizar mayor o menor ancho de banda. Sandy Bridge incluye este canal de comunicación, pero sólo dispone de 16 vías por lo que si conectáramos 2 tarjetas de altas prestaciones (AMD Radeon 5870, Nvidia GTX 480, etc.) estas se repartirían las vias: 8X para cada una limitando el ancho de banda y posiblemente perjudicando levemente las prestaciones.
Estas pequeñas limitaciones también están presentes en los i3, i5 e i7 que utilizan el socket 1156, es por eso que Intel decidió no incluir el canal PCI Express en los i7 de socket 1366: esto se implementa en el chipset X58 que dispone de 40 canales PCI Express 2.0.

No está claro qué pasará con los procesadores de altas prestaciones: todo parece indicar que la apuesta de Intel es seguir con el socket 1366 (los actuales i7 de la serie 9xx) posiblemente lanzando nuevas variantes de 6 núcleos.

Todo hace indicar que se avecinan buenos tiempos para los cálculos en coma flotante y Folding@Home.

Alberto Sánchez González (imrbadguy)

miércoles, 8 de septiembre de 2010

8.000.000

Un nuevo hito en la historia de nuestro humilde equipo: hemos sobrepasado los 8 millones de puntos y las 19.000 WU gracias al esfuerzo colectivo.

Bad guys
Report generated on 15:26:48 September 07, 2010
Date of last work unit 2010-09-07 15:06:57
Active CPUs within 50 days 27
Team Id 54457
Grand Score 8001188 (certificate)
Work Unit Count 19009 (certificate)
Team Ranking (incl. aggregate) 643 of 187057
Home Page http://foldinghomebadguys.blogspot.com/
Fast Teampage URL http://fah-web.stanford.edu/teamstats/team54457.html



Hace poco, en el mes de agosto, tocamos fondo: no podíamos hacerlo peor a no ser que no puntuáramos y se planteaba la sombra de la desaparición del equipo. Pero a penas han pasado 8 días de septiembre y ya hemos puntuado casi tanto como en el mes anterior, gracias al trabajo en equipo: muchos han vuelto cuando más lo necesitábamos.

Espero que esto no sea flor de un día, mucho ha pasado desde que rebasamos los 7 millones de puntos, sino un nuevo camino que se abre ante nosotros y nos puede llevar tan lejos como queramos.

Gracias a todos los que han contribuido, en mayor o menor medida, a este pequeño gran éxito.


Alberto Sánchez González (imrbadguy)

jueves, 2 de septiembre de 2010

Bad guys 1 de Septiembre de 2010

¿Hemos vuelto?

Tras un largo periodo de tiempo, en el que han pasado tantas cosas como se ha degradado el nuestro rendimiento , la intención del que os escribe es reflotar el equipo a partir de ya.

Se acabaron las excusas y el dejarnos caer como si no pasara nada. Es hora de ponerse las pilas y poner toda la carne en el asador. Nuestra actual posición dista mucho de nuestros mejores momentos, llegamos a estar cerca de bajar al 4XX, aquí os dejo la captura del 1 de septiembre para que tengamos un punto de partida: hemos caído, y mucho, pero ahora toca levantarse.

Bad guys

Report generated on 00:32:30 September 01, 2010
Date of last work unit 2010-09-01 00:13:11
Active CPUs within 50 days 25
Team Id 54457
Grand Score 7965485 (certificate)
Work Unit Count 18832 (certificate)
Team Ranking (incl. aggregate) 644 of 186714


Aquí podéis ver los números de los últimos meses desde que dejé de publicar las estadísticas mensuales del equipo en febrero. Nombre del mes, puntos y número de WU.

Agosto 65,715 386
Julio 82,266 561
Junio 118,491 715
Mayo 157,989 869
Abril 206,626 748
Marzo 205,077 544


Los últimos meses han sido decepcionantes, especialmente los veraniegos, así que no perderé tiempo en ver que hizo cada miembro del equipo. Pero sí haré un comentario de cada Bad guy, más que nada para ver lo que creo que podemos esperar de él.

imrbadguy
, espero que solvente sus problemas de infraestructura que lo están lastrando desde hace demasiado tiempo.

Joan_Garcia_Camba, debe volver a ser quien era pues tiene potencial para ser nuestro líder en cuanto a rendimiento al menos.

Flor_PSV, un rendimiento destacable mes a mes y constante.

Fito, un rendimiento estable aunque sin el gran rendimiento del pasado.

Kaiser, su vuelta parece incierta y es una lástima porque su potencial sigue siendo alto.

Punyales_X, un modesto rendimiento a pesar de su gran potencial, espero algo de constancia.

Vito, modesto pero constante su aportación debe ser .

Lito, limitado en cuanto a posibilidades su constancia debería ser total.

imrbadguy-mobile, una aportación modesta pero destacable para sus capacidades.

newdaga_server, espero que siga fiel al equipo, ya que se ha convertido en uno de los intocables mes a mes.

PasswordSTA, nuestro desconocido miembro del equipo sigue aportando mes a mes y espero que continue así con su gran constancia.

Pequenyo_Ruisenyor, importante y constante su rendimiento debe ser.

VeRRoNicAA, su vuelta es una incógnita cada vez más incierta.

rsangros, desaparecido también en 2010 su vuelta parece poco probable pero no es descartable.

Oxilium, la grata sorpresa del mes de agosto aún debe materializar sus primeros puntos en el equipo, ya que de momento aparece con el extraño resultado de 0 puntos y 0 Work Units, pero es una de nuestras mayores esperanzas: la adhesión de nuevos integrantes al equipo. Bienvenido a bordo!!!


El objetivo para este primer mes del curso debe ser superar los 100.000 puntos, antaño superamos los 400.000 por mes, ir paso a paso es importante para afianzar nuestra vuelta. Así que, de momento, nada más.

Hay trabajo que hacer, así que manos a la obra una vez más.


Alberto Sánchez González (imrbadguy)