Casa Internet Ampere une forças com a Qualcomm para lançar um servidor AI baseado em Arm

Ampere une forças com a Qualcomm para lançar um servidor AI baseado em Arm

Ampere e Qualcomm não são os parceiros mais óbvios. Ambos, afinal, oferecem chips baseados em Arm para executar servidores de data center (embora o maior mercado da Qualcomm ainda seja o móvel). Mas, como as duas empresas anunciaram hoje, agora estão unindo forças para oferecer um servidor focado em AI que usa os CPUs da Ampere e os chips de inferência AI Ultra AI 100 da Qualcomm para executar - não treinar - modelos.

Como todo fabricante de chips, a Ampere está buscando lucrar com o boom da AI. No entanto, o foco da empresa sempre foi em chips de servidor rápidos e eficientes em termos de energia, portanto, embora possa usar a IP da Arm para adicionar algumas dessas características aos seus chips, não é necessariamente uma competência central. É por isso que a Ampere decidiu trabalhar com a Qualcomm (e a SuperMicro para integrar as duas soluções), disse o CTO da Arm, Jeff Wittich, ao TechCrunch.

'A ideia aqui é que, enquanto eu lhe mostrarei um ótimo desempenho para CPUs da Ampere executando inferência AI apenas nos CPUs, se você quiser escalar para modelos ainda maiores - por exemplo, modelos com vários 100 bilhões de parâmetros - assim como todas as outras cargas de trabalho, AI não é tamanho único para todos', disse Wittich. 'Estivemos trabalhando com a Qualcomm nesta solução, combinando nossos super eficientes CPUs da Ampere para fazer muitas das tarefas de propósito geral que você está executando em conjunto com a inferência, e então usando seus cartões realmente eficientes, temos uma solução em nível de servidor.'

Créditos da imagem: Ampere

Quanto à parceria com a Qualcomm, Wittich disse que a Ampere queria reunir soluções de melhor qualidade. '

Temos tido uma colaboração muito boa com a Qualcomm aqui', disse ele. 'Esta é uma das coisas em que temos trabalhado, acho que compartilhamos muitos interesses realmente semelhantes, é por isso que acho que isso é realmente convincente. Eles estão construindo soluções realmente, realmente eficientes em muitas partes diferentes do mercado. Estamos construindo soluções realmente, realmente eficientes no lado dos CPUs de servidor.'

A parceria com a Qualcomm faz parte da atualização anual do roadmap da Ampere. Parte desse roadmap é o novo chip AmpereOne de 256 núcleos, construído usando um processo moderno de 3nm. Esses novos chips ainda não estão totalmente disponíveis, mas Wittich diz que estão prontos na fábrica e devem ser lançados ainda este ano.

Além dos núcleos adicionais, o recurso definidor desta nova geração de chips AmpereOne é a DDR5 RAM de 12 canais, que permite aos clientes de data center da Ampere ajustar melhor o acesso à memória dos usuários de acordo com suas necessidades.

A proposta de venda aqui não é apenas o desempenho, mas o consumo de energia e o custo de operar esses chips no data center. Isso é especialmente verdadeiro quando se trata de inferência AI, onde a Ampere gosta de comparar seu desempenho com o das GPUs A10 da Nvidia.

Créditos da imagem: Ampere

Vale ressaltar que a Ampere não está retirando do mercado nenhum de seus chips existentes a favor desses novos. Wittich enfatizou que mesmo esses chips mais antigos ainda têm muitos casos de uso.

A Ampere também anunciou outra parceria hoje. A empresa está trabalhando com a NETINT para construir uma solução conjunta que combina os CPUs da Ampere com os chips de processamento de vídeo da NETINT. Este novo servidor será capaz de transcodificar 360 canais de vídeo ao vivo em paralelo, tudo enquanto também usa o modelo de fala para texto Whisper da OpenAI para legendar 40 streams.

'Começamos por este caminho há seis anos porque está claro que é o caminho certo', disse a CEO da Ampere, Renee James, no anúncio de hoje. 'Energia baixa costumava ser sinônimo de baixo desempenho. A Ampere provou que isso não é verdade. Nós pioneiramos a fronteira da eficiência da computação e entregamos desempenho além dos CPUs legados em um envelope de computação eficiente.'