Nvidia revela o supercomputador pessoal / Notícia

Aproveitar o poder da GPU além da saída gráfica básica foi inevitavelmente fortalecido pela Nvidia como o próximo grande salto de computação. Essa confiança faz com que as GPUs de processamento geral (GPGPUs) estejam no PC de todos os que lançaram uma série de placas de plug-in baseadas em GPU high-end com o nome Tesla..

Os números contribuem para uma leitura convincente com os mais recentes produtos da série 10 na gama Tesla da Nvidia, citando até 960 núcleos e até 4 teraflops de desempenho. Antes de ficar todo excitado, os núcleos mencionados são na verdade encadeamentos do processador de sombreamento.

A menos que o aplicativo escolhido seja executado de maneira ideal em um ambiente de ponto flutuante acelerado, você não verá muito da Nvidia citada "250 vezes o desempenho de computação de um PC". Dito isso, o ambiente de programação CUDA da Nvidia (veja abaixo) foi projetado para explorar a arquitetura especificamente projetada da Tesla e iniciar o processo de desenvolvimento da próxima geração de aplicativos..

Cálculos de dados intensivos

As origens da Tesla são bastante humildes, tendo originalmente originado das GPUs da Série GeForce 8, daí os produtos originais da Tesla Série 8. Como se para enfatizar suas intenções para o mercado de computação de alto desempenho (HPC), a Nvidia eliminou qualquer coisa tola como as saídas de vídeo. Os aplicativos e setores atuais direcionados a esse produto precisam da potência necessária para realizar cálculos complexos com uso intenso de dados em sua mesa, processando mais dados com mais rapidez e reduzindo o tempo necessário para obter resultados.

Dr. Graham Pullen, da Universidade de Cambridge, deu um exemplo convincente de aproveitar o poder de um sistema de mesa da Tesla lançado contra um sistema de CPU quad core de 2.5GHz. Usando análise dinâmica de fluidos, a forma e as posições das pás de uma turbina são ajustadas para um fluxo ótimo.

Os resultados de testes que normalmente eram retornados em mais de 12 horas no sistema somente da CPU, eram retornados em minutos em sistemas aprimorados por Tesla. Se uma única lâmina fosse focada, os resultados retornados eram quase em tempo real. Isso permite que os engenheiros ajustem o melhor desempenho em tempo real, a fim de obter designs ideais muito mais rapidamente.

O benefício final para tal caminhada no desempenho computacional não é apenas para os engenheiros a velocidade de receber os resultados dos testes - a redução maciça nos esforços computacionais leva subsequentemente a uma enorme economia de energia. O Dr. Pullen também destacou outro grande benefício que visava especificamente a supercompensação dos limites de projeto na engenharia, muitos deles por motivos de segurança..

O tempo necessário para concluir testes extremamente complexos com qualquer precisão real é muitas vezes proibitivo e, por isso, o mundo da engenharia teve que conviver com estimativas ineficientes já há algum tempo. Com o mundo científico relatando testes acelerados de até 250 vezes suas configurações padrão, menos material levando a equipamentos mais leves e mais fortes e, no caso de motores, com uso de combustível mais eficiente, será a norma.

Deixando de lado a comunidade científica, vários fabricantes de PCs bem conhecidos, incluindo a Dell, já entraram no carrinho da Tesla. Disponível agora está a workstation Dell Precision T7400 com o modelo único GPU C1060 do Tesla da Nvidia com um sistema de rack de 4 GPU S1070 1U também disponível. Os preços dependem da especificação geral escolhida, mas esperam pagar menos de US $ 10.000 por um sistema que, pelo menos para algumas aplicações, poderia superar o desempenho de um sistema baseado em CPU 10 vezes.

A Intel, com o Larabee, e a AMD / ATi, com o Stream, provavelmente participarão do GPGPU no final de 2009. Assim que tivermos uma concorrência decente de preços, poderemos estar olhando para um supercomputador de menos de 1.000 libras sob sua mesa. jogando fora 10.000 fps de Crysis mayhem!

O que é o CUDA??

O CUDA, originalmente derivado da Compute Unified Device Architecture, é o mecanismo de computação dentro das GPUs da Nvidia. Ele pode ser programado diretamente usando a linguagem de programação C padrão do setor, com algumas extensões. APIs como OpenCL e DirectX 11 também são suportadas. O OpenCL, ou Open Computing Language, é usado para programação heterogênea - tarefas de processamento de dados em GPUs paralelas e configurações de CPU, o que anuncia um futuro para os aplicativos tradicionais se beneficiarem da Tesla e produtos similares.

Usando CUDA, as mais recentes GPUs da Nvidia tornam-se efetivamente arquiteturas abertas, assim como as CPUs, com a ressalva de que as GPUs são mais adequadas para aplicativos de processamento onde os conjuntos de dados são vastos e formatados para rodar sobre a arquitetura paralela "muitos núcleos" do shader da GPU ambiente de thread. Tradicionalmente, a renderização de jogos e os cálculos de física foram perfeitamente adequados a esse ambiente, mas agora o CUDA está sendo usado para acelerar aplicativos não-gráficos, como engenharia e análise de tendências de mercados de ações..

-------------------------------------------------------------------------------------------------------

Agora leia o melhor guia para placas gráficas

Inscreva-se para receber gratuitamente o boletim informativo semanal da TechRadar
Receba notícias sobre tecnologia diretamente na sua caixa de entrada. Registre-se para receber a newsletter gratuita da TechRadar e fique por dentro das maiores histórias e lançamentos de produtos da semana. Inscreva-se em http://www.techradar.com/register