El poder del procesamiento paralelo de Nvidia CUDA

Tema: 

Recientemente Nvidia ha sacado al mercado un nuevo software llamado CUDA (Compute Unified Device Architecture).

El objetivo de este software, disponible para Linux y Windows es aprovechar el procesamiento de puntos flotantes (FLOPS) que tienen las tarjetas de vídeo hoy en día, que es aun muy superior a los FLOPS de cualquier procesador AMD e Intel, ya que si bien AMD es quien lleva la ventaja con un límite actual de +/- 15 Gflops (Athlon 64 X2 4600), pero eso no se compara con los +/- 500 Gflops (ATI X1900)de las tarjetas de video profesionales, cuyo poder de procesamiento no se aprovecha al 100% ya que el diseño original era de GPU y no de CPU. Es donde nace CUDA.

Este software hace que el GPGPU se comporte como tal cuando se procese video y como un coprocesador CPU cuando se procesen otro tipo de datos, haciendo de esta manera que una PC moderna casera se acerque más al comportamiento de un Supercomputador.

A esto se suma ATI, empresa de AMD, que está desarrollando un chip llamado fusion, que integra CPU y GPU.

Básicamente CUDA es un conjunto de herramientas y librerías en lenguaje C que crean un núcleo (kernel) paralelo.

Ver más:
NVIDIA CUDA Homepage
GigaFLOPS y el cerebro humano
What's so hard about doing non-graphics programming on a GPU?
A quick programmer’s look at NVIDIA’s CUDA

Comentarios

Asi es dias pasados revice

Imagen de damage

Asi es dias pasados revice eso, y es màs envidia tien sus propios equipos llamados Tesla, son increibles, solo la tarjeta Tesla C870 procesa +/- 500Gflops, y ellos tiene servidores donde puedes poner 4 de estas tarjetas teniendo 2000Gflops , da miedo esta cantidad :cool:.
Que pasara a futuro con la comprade ATI por parte de AMD, ahora si Intel debe estar viendo la cosa medio negra.

Keep The Fire Burning.....
Stryper 1988
http://counter.li.org/

Un poco desactualizado

Un core 2 duo de 2.44Ghz procesa 19GFLOPS (comprobado), un core 2 quad procesa 45GFLOPS a 50, ganandole a los 42GFLOPS del amd de cuatro nucleos.

Yo tengo una ATI 2900 y este procesa entre 420/470GFLOPS (Los juegos actuales renderizan con todos los efectos al maximo escenarios y personajes con una cantidad de detalle impresionante), Yo tuve una ATI 1900 y no llega a los 500GFLOPS, el calculo maximo en condiciones normales llega solo a 320GFLOPS(que no es poco), esto va a ser mas facil por que con las tarjetas dx10 y su soporte de shader unificados y por que al eliminar el dx9 overhead, se puede mandar a calcular no solo graficos en las gpu, sino tambien otros tipos de datos, por eso los ati y nvidia ponen sus tarjetas como soluciones de calculo para sistemas de simulacion (y no es para menos por la cantidad de datos que calculan en ATI 2900 y Geforce 8800).

Por esta posibilidad la ATI 2900 viene con soporte de audio 5.1 para HDMI, calculado por la GPU. Ademas de procesador de fisicas tambien calculado por la GPU y quien sabe para que mas aparesca que aproveche esta posibilidad.

=============================================
Intel Core 2 Duo 2.4Ghz@3.2Ghz, 3GB RAM DDR2, Mainboard ABIT iP35 PRO, Nvidia Geforce 9600GT 512MB, 1024GB SATA II, Sound Blaster XFI XtremeMusic

Eso es teoría

Si vamos a la teoría, también te dijera que AMD procesa +/- 70 GFLOPS, lo cual no es cierto. Ni Intel procesa 42, ni AMD 70, lo que si es cierto es que en GFLOPS siempre estará AMD sobre Intel, pero esto no es suficiente. Simple, la diferencias de arquitecturas: La principal AMD tiene su "Northbridge" en su procesador mientras que Intel los tiene en los mainboards, eso hace que jamás Intel iguale a AMD en GFLOPS.

Recuerdo un peque análisis que hice de los procesadores AMD, y es que su procesamiento flop (llámese numérico-lógico) es 4 veces superior.

Lo que estamos viendo es el devenir de la inteligencia artificial ya que aunque por más que se mejoren los procesadores, no importa cuál sea mejor, siempre las tarjetas de video los superaran.

Veremos que pasa en unos añitos.

Además para completar la

Imagen de damage

Además para completar la cosa entre AMD e Intel, como se puede ocurrir, poner a competir procesadores de 2 Core's con Quad-Core's, osea, es ridiculo no seria una comparación objetiva pero aun justa, por supuesto que un intel Core4 procesa mas que un X2 de AMD, pero solo será de esperar a los 3 Cores o los QuadCores nuevos que AMD lanzara pronto. Ahi la balanza una vez más elevara a AMD.

Keep The Fire Burning.....
Stryper 1988
http://counter.li.org/

Además para completar la

Imagen de damage

Además para completar la cosa entre AMD e Intel, como se puede ocurrir, poner a competir procesadores de 2 Core's con Quad-Core's, osea, es ridiculo no seria una comparación objetiva pero aún justa, por supuesto que un intel Core4 procesa más que un X2 de AMD, pero solo será de esperar a los 3 Cores o los QuadCores nuevos que AMD lanzara pronto. Ahi la balanza una vez más elevara a AMD.

Keep The Fire Burning.....
Stryper 1988
http://counter.li.org/

Disculpen

Pero ya hay los quad cores de Intel y AMD, yo he probado estos dos procesadores personalmente en sus versiones extreme y he hecho los benckmarks y Intel le gana a AMD, y el Intel procesa 45GFLOPS y el AMD Opteron de 4 nucleos 42 GFLOPS (en condiciones de hardware standar) ya con mejor memoria (800MHZ o 1066MHZ) y una mejor mainboard puede subir hasta 50GFLOPS el Intel y el AMD hasta 48GFLOPS (comprobado personalmente).

Ademas el Intel se calienta menos.

Saludos.

=============================================
Intel Core 2 Duo 2.4Ghz@3.2Ghz, 3GB RAM DDR2, Mainboard ABIT iP35 PRO, Nvidia Geforce 9600GT 512MB, 1024GB SATA II, Sound Blaster XFI XtremeMusic

Cómo hiciste los

Cómo hiciste los cálculos?
Trabajas para Intel?

Si hablamos de Opteron, estas casi duplican los Gflops de Intel en teoría.

En todo caso, sería bueno que subas tu investigación personal como un aporte a nuestro conocimiento.