sábado, 21 de junio de 2008

Rendimiento de Folding@Home

Recientemente se ha estrenado en Folding@Home un nuevo cliente GPU2 en fase beta para las GPUs de Nvidia, lo cuál, junto a la solución de un problema en la versión del driver 8.5 de las tarjetas AMD/ATI que incapacitaba a las Radeon de las serie 2XXX, 3XXX y a la novísima 4850 para participar, ha provocado un notable incremento en el rendimiento del cliente GPU.

La siguiente tabla muestra el rendimiento actual de los diferentes clientes según la arquitectura y el sistema operativo:

OS Type Current TFLOPS* Active CPUs Total CPUs
Windows 1962059232060596
Mac OS X/PowerPC 78487116630
Mac OS X/Intel 26832451948
Linux 7242257311396
GPU 604549112671
PLAYSTATION®3 143450845543382
Total 2339321327 3096623


El rendimiento total es de 2339 TeraFLOPS, no olvidemos que son 2'3 millones de GigaFLOPS. Para poner en perspectiva esta medida de la potencia de cálculo en coma flotante, podemos echar un vistazo a la recientemente publicada lista de los 500 ordenadores más potentes del mundo, la lista completa la tenéis disponible en www.top500.org.

En la siguiente tabla tenemos las columnas:
  • cores: número total de núcleos del sistema;
  • Rmax: rendimiento máximo obtenido con LINPACK, en TeraFLOPS;
  • Rpeak: rendimiento teórico máximo, en TeraFLOPS.

RankComputer/Year VendorCoresRmaxRpeak
1Roadrunner - BladeCenter QS22/LS21 Cluster, PowerXCell 8i 3.2 Ghz / Opteron DC 1.8 GHz , Voltaire Infiniband / 2008
IBM
1224001026.001375.78
2BlueGene/L - eServer Blue Gene Solution / 2007
IBM
212992478.20596.38
3Blue Gene/P Solution / 2007
IBM
163840450.30557.06
4Ranger - SunBlade x6420, Opteron Quad 2Ghz, Infiniband / 2008
Sun Microsystems
62976326.00503.81
5Jaguar - Cray XT4 QuadCore 2.1 GHz / 2008
Cray Inc.
30976205.00260.20
6JUGENE - Blue Gene/P Solution / 2007
IBM
65536180.00222.82
7Encanto - SGI Altix ICE 8200, Xeon quad core 3.0 GHz / 2007
SGI
14336133.20172.03
8EKA - Cluster Platform 3000 BL460c, Xeon 53xx 3GHz, Infiniband / 2008
Hewlett-Packard
14384132.80172.61
9Blue Gene/P Solution / 2008
IBM
40960112.50139.26
10SGI Altix ICE 8200EX, Xeon quad core 3.0 GHz / 2008
SGI
10240106.10122.88


El rendimiento máximo lo obtiene RoadRunner con 1026 TeraFLOPS y 122400 cores, ya que es un sistema heterogéneo que combina procesadores CELL y Opteron Dual Core entre otros. Su eficiencia es mucho mayor en cuanto a que combina muchos menos procesadores que el global del máquinas de Folding@Home y su rendimiento debe ser más consistente, pero también su rendimiento global es la mitad.

¿Qué quiero decir? Pues que el potencial de cálculo de sistemas distribuídos como el de Folding@Home es muy elevado, más cuando se está empezando a utilizar la ingente potencia de cálculo de las GPUs y CPUs actuales.

Las GPUs evolucionan más rápido que los procesadores, ya que tienen un ciclo de vida más corto y cada 6-9 meses hay una hornada nueva que supera a la anterior de forma notable. Los procesadores por su parte evolucionan a un ritmo menor, si bien es cierto que son más flexibles y están destinados a realizar operaciones muy diferentes.

Lo importante en todo caso es que el software se adapte a las diferentes soluciones hardware disponibles lo antes posible, ya que de lo contrario estaremos desperdiciando el gran potencial que se empieza a esconder en nuestros sistemas domésticos que, pese al avance constante, siguen siendo muy limitados y estando muy lejos de poder realizar cálculos complejos en tiempo real.

Alberto Sánchez González (imrbadguy)