Home Lançamentos Rubin e a nova geração de IA da NVIDIA

Rubin e a nova geração de IA da NVIDIA

por Paulo Fernandes Maciel

NVIDIA dá início à próxima geração de IA com Rubin — seis novos chips e um incrível supercomputador de IA


A integração extrema de CPU NVIDIA Vera, GPU Rubin, switch NVLink 6, SuperNIC ConnectX-9, DPU BlueField-4 e switch Ethernet Spectrum-6 reduz drasticamente o tempo de treinamento e o custo de geração de tokens de inferência.

CES — A NVIDIA dá o pontapé inicial para a próxima geração de IA com o lançamento da plataforma NVIDIA Rubin, composta por seis novos chips projetados para oferecer um supercomputador de IA incrível. A NVIDIA Rubin estabelece um novo padrão para a construção, implantação e segurança dos maiores e mais avançados sistemas de IA do mundo, com o menor custo, para acelerar a adoção da IA pelo público em geral.

A plataforma Rubin aproveita o design conjunto extremo em hardware e software para oferecer uma redução de até 10 vezes no custo do token de inferência e uma redução de 4 vezes no número de GPUs necessárias para treinar modelos MoE, em comparação com a plataforma NVIDIA Blackwell.


A plataforma Rubin utiliza um design conjunto extremo em seus seis chips — a CPU NVIDIA Vera, a GPU NVIDIA Rubin, o switch NVIDIA NVLink™ 6, a SuperNIC NVIDIA ConnectX®-9, a DPU NVIDIA BlueField®-4 e o switch Ethernet NVIDIA Spectrum™-6 — para reduzir drasticamente o tempo de treinamento e os custos de tokens de inferência.
“Rubin chega exatamente no momento certo, já que a demanda por computação de IA, tanto para treinamento quanto para inferência, está disparando”, diz Jensen Huang, fundador e CEO da NVIDIA. “Com nosso ritmo anual de lançamento de uma nova geração de supercomputadores de IA — e o design colaborativo extremo em seis novos chips — Rubin dá um salto gigantesco rumo à próxima fronteira da IA.”

Rubin

Os sistemas de comutação NVIDIA Spectrum-X Ethernet Photonics oferecem eficiência energética e tempo de atividade 5 vezes maiores.


Batizada em homenagem a Vera Florence Cooper Rubin — a pioneira astrônoma americana cujas descobertas transformaram a compreensão da humanidade sobre o universo — a plataforma Rubin apresenta a solução NVIDIA Vera Rubin NVL72 em escala de rack e o sistema NVIDIA HGX Rubin NVL8.
“Rubin consolida a infraestrutura como a base estratégica da IA moderna. Ao integrar computação, redes, armazenamento e software desde a fase de projeto, a NVIDIA permite que as empresas operem modelos cada vez mais complexos com previsibilidade, eficiência e custo-benefício em escala”, afirma Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para a América Latina.

Nova plataforma de armazenamento NVIDIA Inference Context Memory com processador de armazenamento NVIDIA BlueField-4 para acelerar o raciocínio de IA agêntica.


A plataforma Rubin introduz cinco inovações, incluindo as gerações mais recentes da tecnologia de interconexão NVIDIA NVLink, o Transformer Engine, o Confidential Computing e o RAS Engine, bem como a CPU NVIDIA Vera. Esses avanços acelerarão a IA agêntica, o raciocínio avançado e a inferência de modelos de mistura de especialistas (MoE) em larga escala, com um custo por token até 10 vezes menor do que a plataforma NVIDIA Blackwell. Comparada à sua antecessora, a plataforma NVIDIA Rubin treina modelos MoE com 4 vezes menos GPUs para acelerar a adoção da IA.


Amplo suporte do ecossistema


Entre os principais laboratórios de IA, provedores de serviços em nuvem, fabricantes de computadores e startups do mundo que devem adotar o Rubin estão Amazon Web Services (AWS), Anthropic, Black Forest Labs, Cisco, Cohere, CoreWeave, Cursor, Dell Technologies, Google, Harvey, HPE, Lambda, Lenovo, Meta, Microsoft, Mistral AI, Nebius, Nscale, OpenAI, OpenEvidence, Oracle Cloud Infrastructure (OCI), Perplexity, Runway, Supermicro , Thinking Machines Lab e xAI.

Rubin


Sam Altman, CEO da OpenAI: “A inteligência se expande com a capacidade computacional. Quando adicionamos mais poder computacional, os modelos se tornam mais capazes, resolvem problemas mais complexos e geram um impacto maior para as pessoas. A plataforma NVIDIA Rubin nos ajuda a continuar expandindo esse progresso para que a inteligência avançada beneficie a todos.”

As superfábricas de IA de última geração da Microsoft em Fairwater — equipadas com sistemas NVIDIA Vera Rubin NVL72 em escala de rack — serão escaláveis para centenas de milhares de Superchips NVIDIA Vera Rubin.


Dario Amodei, cofundador e CEO da Anthropic: “Os ganhos de eficiência na plataforma NVIDIA Rubin representam o tipo de progresso em infraestrutura que possibilita maior capacidade de memória, melhor raciocínio e resultados mais confiáveis. Nossa colaboração com a NVIDIA ajuda a impulsionar nossa pesquisa em segurança e nossos modelos de vanguarda.”
Mark Zuckerberg, fundador e CEO da Meta: “A plataforma Rubin da NVIDIA promete oferecer a mudança radical em desempenho e eficiência necessária para implementar os modelos mais avançados em bilhões de pessoas.”

A CoreWeave foi uma das primeiras a oferecer o NVIDIA Rubin, operado através do CoreWeave Mission Control para mais flexibilidade e desempenho.


Elon Musk, fundador e CEO da xAI: “O NVIDIA Rubin será um motor de foguete para IA. Se você quer treinar e implantar modelos de ponta em escala, esta é a infraestrutura que você usa — e o Rubin lembrará ao mundo que a NVIDIA é o padrão ouro.”
Satya Nadella, presidente executivo e CEO da Microsoft: “Estamos construindo as superfábricas de IA mais poderosas do mundo para atender a qualquer carga de trabalho, em qualquer lugar, com o máximo desempenho e eficiência. Com a adição das GPUs NVIDIA Vera Rubin, capacitaremos desenvolvedores e organizações a criar, raciocinar e escalar de maneiras totalmente novas.”


Mike Intrator, cofundador e CEO da CoreWeave: “Criamos a CoreWeave para ajudar pioneiros a acelerar suas inovações com o desempenho incomparável de nossa plataforma de IA desenvolvida especificamente para esse fim, combinando a tecnologia certa com as cargas de trabalho certas à medida que evoluem. A plataforma NVIDIA Rubin representa um avanço importante para cargas de trabalho de raciocínio, agentes e inferência em larga escala, e estamos entusiasmados em adicioná-la à nossa plataforma. Com o CoreWeave Mission Control como padrão operacional, podemos integrar novos recursos rapidamente e executá-los de forma confiável em escala de produção, trabalhando em estreita parceria com a NVIDIA.”


Matt Garman, CEO da AWS: “A AWS e a NVIDIA têm impulsionado a inovação em IA na nuvem juntas há mais de 15 anos. A plataforma NVIDIA Rubin na AWS representa nosso compromisso contínuo em fornecer infraestrutura de IA de ponta que oferece aos clientes opções e flexibilidade incomparáveis. Ao combinar a tecnologia avançada de IA da NVIDIA com a escalabilidade, segurança e serviços abrangentes de IA comprovados da AWS, os clientes podem criar, treinar e implantar suas aplicações de IA mais exigentes com mais rapidez e custo-benefício — acelerando seu caminho da experimentação à produção em qualquer escala.”


Sundar Pichai, CEO do Google e da Alphabet: “Temos orgulho da nossa relação sólida e duradoura com a NVIDIA. Para atender à demanda substancial que observamos pelas GPUs NVIDIA, estamos focados em fornecer o melhor ambiente possível para o hardware deles no Google Cloud. Nossa colaboração continuará à medida que levarmos os recursos impressionantes da plataforma Rubin aos nossos clientes, oferecendo a eles a escala e o desempenho necessários para expandir os limites da IA.”


Clay Magouyrk, CEO da Oracle: “A Oracle Cloud Infrastructure é uma nuvem hiperescalável criada para o mais alto desempenho e, juntamente com a NVIDIA, estamos expandindo os limites do que os clientes podem construir e escalar com IA. Com fábricas de IA em escala gigabit, impulsionadas pela arquitetura NVIDIA Vera Rubin, a OCI está fornecendo aos clientes a base de infraestrutura necessária para expandir os limites do treinamento de modelos, inferência e impacto da IA no mundo real.”


Michael Dell, presidente e CEO da Dell Technologies: “A plataforma NVIDIA Rubin representa um grande avanço na infraestrutura de IA. Ao integrar o Rubin à Dell AI Factory com a NVIDIA, estamos construindo uma infraestrutura capaz de lidar com volumes massivos de tokens e raciocínio em várias etapas, oferecendo o desempenho e a resiliência que empresas e neoclouds precisam para implantar IA em escala.”


Antonio Neri, presidente e CEO da HPE: “A IA está remodelando não apenas as cargas de trabalho, mas também os próprios fundamentos da TI, exigindo que repensemos cada camada da infraestrutura, da rede à computação. Com a plataforma NVIDIA Vera Rubin, a HPE está construindo a próxima geração de infraestrutura segura e nativa para IA transformando dados em inteligência e permitindo que as empresas se tornem verdadeiras fábricas de IA.”


Yuanqing Yang, presidente e CEO da Lenovo: “A Lenovo está adotando a plataforma NVIDIA Rubin de última geração, aproveitando nossa solução de resfriamento líquido Neptune, bem como nossa escala global, eficiência de fabricação e alcance de serviços, para ajudar as empresas a construir fábricas de IA que sirvam como motores inteligentes e acelerados para insights e inovação. Juntos, estamos arquitetando um futuro orientado por IA, onde a IA eficiente e segura se torna o padrão para todas as organizações.”


Projetada para escalar a inteligência


Agentes de IA e os modelos de raciocínio, juntamente com cargas de trabalho de geração de vídeo de última geração, estão redefinindo os limites da computação. A resolução de problemas em várias etapas exige que os modelos processem, raciocinem e ajam em longas sequências de tokens.

Projetada para atender às demandas de cargas de trabalho complexas de IA, a plataforma Rubin inclui cinco tecnologias inovadoras:


NVIDIA NVLink de sexta geração:

oferece a comunicação GPU-a-GPU rápida e perfeita necessária para os modelos MoE massivos de hoje. Cada GPU oferece 3,6 TB/s de largura de banda, enquanto o rack Vera Rubin NVL72 fornece 260 TB/s — mais largura de banda do que toda a internet. Com computação integrada na rede para acelerar as operações coletivas, bem como novos recursos para maior facilidade de manutenção e resiliência, o switch NVIDIA NVLink 6 permite treinamento e inferência de IA mais rápidos e eficientes em escala.

Processador NVIDIA Vera:projetado para raciocínio autônomo, o NVIDIA Vera é o processador mais eficiente em termos de energia para grandes fábricas de IA. O processador NVIDIA é construído com 88 núcleos Olympus personalizados da NVIDIA, total compatibilidade com Armv9.2 e conectividade NVLink-C2C ultrarrápida. O Vera oferece desempenho excepcional, largura de banda e eficiência líder do setor para suportar uma ampla gama de cargas de trabalho de data centers modernos.

GPU NVIDIA Rubin:equipada com um Transformer Engine de terceira geração com compressão adaptativa acelerada por hardware, a GPU Rubin oferece 50 petaflops de poder computacional NVFP4 para inferência de IA;

Computação Confidencial NVIDIA de Terceira Geração:o Vera Rubin NVL72 é a primeira plataforma em escala de rack a oferecer Computação Confidencial NVIDIA — que mantém a segurança dos dados nos domínios de CPU, GPU e NVLink — protegendo os maiores modelos proprietários, cargas de trabalho de treinamento e inferência do mundo.

Mecanismo RAS de segunda geração:a plataforma Rubin — que abrange GPU, CPU e NVLink — apresenta verificações de integridade em tempo real, tolerância a falhas e manutenção proativa para maximizar a produtividade do sistema. O design modular e sem cabos do rack permite montagem e manutenção até 18 vezes mais rápidas do que o Blackwell.
Armazenamento nativo para IA e infraestrutura segura definida por software


NVIDIA Rubin apresenta a plataforma NVIDIA Inference Context Memory Storage, uma nova classe de infraestrutura de armazenamento nativa para IA projetada para escalar o contexto de inferência em gigaescala.
Com a tecnologia NVIDIA BlueField-4, a plataforma permite o compartilhamento e a reutilização eficientes de dados de cache de chave-valor em toda a infraestrutura de IA melhorando a capacidade de resposta e a taxa de transferência, além de possibilitar o escalonamento previsível e com baixo consumo de energia da IA ativa.


À medida que as fábricas de IA adotam cada vez mais modelos de implantação bare-metal e multi-tenant, manter um forte controle e isolamento da infraestrutura torna-se essencial.


O BlueField-4 também introduz a Advanced Secure Trusted Resource Architecture, ou ASTRA, uma arquitetura de confiança em nível de sistema que oferece aos construtores de infraestrutura de IA um ponto de controle único e confiável para provisionar, isolar e operar ambientes de IA em larga escala com segurança, sem comprometer o desempenho.
Com a evolução das aplicações de IA em direção ao raciocínio de agentes de múltiplas etapas, as organizações nativas de IA precisam gerenciar e compartilhar volumes muito maiores de contexto de inferência entre usuários, sessões e serviços.
Diferentes formatos para diferentes cargas de trabalho


A NVIDIA Vera Rubin NVL72 oferece um sistema unificado e seguro que combina 72 GPUs NVIDIA Rubin, 36 CPUs NVIDIA Vera, NVIDIA NVLink 6, SuperNICs NVIDIA ConnectX-9 e DPUs NVIDIA BlueField-4.
A NVIDIA também oferecerá a plataforma NVIDIA HGX Rubin NVL8, uma placa-mãe para servidores que interliga oito GPUs Rubin por meio de NVLink para suportar plataformas de IA generativa baseadas em x86. A plataforma HGX Rubin NVL8 acelera o treinamento, a inferência e a computação científica para cargas de trabalho de IA e computação de alto desempenho.


O NVIDIA DGX SuperPOD ™ serve como referência para a implantação em larga escala de sistemas baseados em Rubin, integrando os sistemas NVIDIA DGX Vera Rubin NVL72 ou DGX Rubin NVL8 com DPUs NVIDIA BlueField-4, SuperNICs NVIDIA ConnectX-9, redes NVIDIA InfiniBand e o software NVIDIA Mission Control ™.


Redes Ethernet de próxima geração


Redes e armazenamento Ethernet avançados são componentes da infraestrutura de IA essenciais para manter os data centers funcionando em plena capacidade, melhorando o desempenho e a eficiência e reduzindo custos.
O NVIDIA Spectrum-6 Ethernet é a próxima geração de Ethernet para redes de IA, projetada para escalar fábricas de IA baseadas em Rubin com maior eficiência e resiliência, e habilitada por circuitos de comunicação SerDes de 200G, óptica co-embalada e estruturas otimizadas para IA.


Baseados na arquitetura Spectrum-6, os sistemas de comutação óptica co-empacotados Spectrum-X Ethernet Photonics oferecem confiabilidade 10 vezes maior e tempo de atividade 5 vezes mais longo para aplicações de IA, além de alcançarem eficiência energética 5 vezes superior, maximizando o desempenho por watt em comparação com os métodos tradicionais.

A tecnologia Ethernet Spectrum-XGS, parte da plataforma Ethernet Spectrum-X, permite que instalações separadas por centenas de quilômetros ou mais funcionem como um único ambiente de IA.
Em conjunto, essas inovações definem a próxima geração da plataforma NVIDIA Spectrum-X Ethernet, projetada com extrema colaboração para Rubin, permitindo fábricas de IA em larga escala e abrindo caminho para futuros ambientes com milhões de GPUs.


Preparação para o Rubin


O NVIDIA Rubin está em plena produção e os produtos baseados em Rubin estarão disponíveis por meio de parceiros no segundo semestre de 2026.
Entre os primeiros provedores de nuvem a implantar instâncias baseadas em Vera Rubin em 2026 estarão AWS, Google Cloud, Microsoft e OCI, bem como os parceiros de nuvem da NVIDIA: CoreWeave, Lambda, Nebius e Nscale.
A Microsoft implantará sistemas NVIDIA Vera Rubin NVL72 em escala de rack como parte de data centers de IA de última geração, incluindo as futuras superfábricas de IA em Fairwater.


Projetada para oferecer eficiência e desempenho sem precedentes para cargas de trabalho de treinamento e inferência, a plataforma Rubin fornecerá a base para os recursos de IA em nuvem de próxima geração da Microsoft. O Microsoft Azure oferecerá uma plataforma altamente otimizada, permitindo que os clientes acelerem a inovação em aplicações empresariais, de pesquisa e de consumo.


A CoreWeave integrará sistemas baseados em NVIDIA Rubin à sua plataforma de nuvem de IA a partir do segundo semestre de 2026. A CoreWeave foi projetada para operar múltiplas arquiteturas simultaneamente, permitindo que os clientes incorporem o Rubin em seus ambientes, onde ele proporcionará o maior impacto em cargas de trabalho de treinamento, inferência e agentes.


Em conjunto com a NVIDIA, a CoreWeave ajudará os pioneiros da IA a tirarem proveito dos avanços de Rubin em raciocínio e modelos MoE, ao mesmo tempo que continuará a fornecer o desempenho, a confiabilidade operacional e a escalabilidade necessários para a IA de produção em todo o ciclo de vida com o CoreWeave Mission Control.
Além disso, espera-se que Cisco,, DellHPELenovo e Supermicro forneçam uma ampla gama de servidores baseados em produtos Rubin.


Laboratórios de IA incluindo Anthropic, Black Forest, Cohere, Cursor, Harvey, Meta, Mistral AI, OpenAI, OpenEvidence, Perplexity, Runway, Thinking Machines Lab e xAI, estão de olho na plataforma NVIDIA Rubin para treinar modelos maiores e mais capazes e para atender a sistemas multimodais de longo contexto com menor latência e custo do que com as gerações anteriores de GPUs.


Os parceiros de software e armazenamento de infraestrutura AIC, Canonical, Cloudian, DDN, Dell, HPE, Hitachi Vantara, IBM, NetApp, Nutanix, Pure Storage, Supermicro, SUSE, VAST Data e WEKA estão trabalhando com a NVIDIA para projetar plataformas de próxima geração para a infraestrutura Rubin.
A plataforma Rubin marca a terceira geração da arquitetura de rack da NVIDIA, com mais de 80 parceiros do ecossistema NVIDIA MGX™.

Ampliação da colaboração com a Red Hat para fornecer um conjunto completo de soluções de IA otimizado para a plataforma Rubin, incluindo Red Hat Enterprise Linux, Red Hat OpenShift e Red Hat AI.

Rubin


Para desbloquear essa densidade, a Red Hat anuncia  uma colaboração ampliada com a NVIDIA para fornecer uma pilha completa de IA otimizada para a plataforma NVIDIA Rubin com o portfólio de nuvem híbrida da Red Hat, incluindo Red Hat Enterprise Linux, Red Hat OpenShift e Red Hat AI. Essas soluções são utilizadas pela grande maioria das empresas da lista Fortune Global 500.


Saiba mais assistindo à apresentação NVIDIA Live na CES e lendo o material técnico “Inside Vera Rubin”

Sobre a NVIDIA


Desde sua fundação em 1993, a NVIDIA (NASDAQ: NVDA) tem sido pioneira em computação acelerada. A invenção da GPU pela empresa em 1999 estimulou o crescimento do mercado de games para PC, redefiniu a computação gráfica, iniciou a era da IA moderna e tem ajudado a digitalização industrial em todos os mercados. A NVIDIA agora é uma empresa de infraestrutura de computação full-stack com soluções em escala de data center que estão revolucionando o setor.

Mais informações em: https://www.nvidia.com/pt-br/


Acesse também:


Facebook: @NVIDIABrasil
Twitter: @NVIDIABrasil
YouTube: NVIDIA Latinoamérica
Instagram: @NVIDIABrasil

Declarações prospectivas

Certas declarações neste comunicado de imprensa, incluindo, entre outras, declarações sobre: a chegada do Rubin exatamente no momento certo; com nossa cadência anual de entrega de uma nova geração de supercomputadores de IA — e o design conjunto extremo em seis novos chips — o Rubin dando um salto gigantesco em direção à próxima fronteira da IA;

Os benefícios, o impacto, o desempenho e a disponibilidade dos produtos, serviços e tecnologias da NVIDIA;

Expectativas com relação aos acordos da NVIDIA com terceiros, incluindo seus colaboradores e parceiros;

Expectativas com relação aos desenvolvimentos tecnológicos; e outras declarações que não são fatos históricos são declarações prospectivas, conforme definido na Seção 27A da Lei de Valores Mobiliários de 1933, conforme alterada, e na Seção 21E da Lei de Bolsa de Valores de 1934, conforme alterada, que estão sujeitas à “proteção legal” criada por essas seções com base nas crenças e suposições da administração e nas informações atualmente disponíveis para a administração, e estão sujeitas a riscos e incertezas que podem fazer com que os resultados sejam materialmente diferentes das expectativas.

Fatores importantes que podem fazer com que os resultados reais sejam materialmente diferentes incluem: condições econômicas e políticas globais;

A dependência da NVIDIA em terceiros para fabricar, montar, embalar e testar seus produtos;

O impacto do desenvolvimento tecnológico e da concorrência; o desenvolvimento de novos produtos e tecnologias ou aprimoramentos nos produtos e tecnologias existentes da NVIDIA;

A aceitação de mercado dos produtos da NVIDIA ou dos produtos de seus parceiros; defeitos de projeto, fabricação ou software; mudanças nas preferências ou demandas dos consumidores;

Mudanças nos padrões e interfaces do setor; perda inesperada de desempenho dos produtos ou tecnologias da NVIDIA quando integrados a sistemas; e mudanças nas leis e regulamentações aplicáveis, bem como outros fatores detalhados periodicamente nos relatórios mais recentes que a NVIDIA apresenta à Comissão de Valores Mobiliários dos EUA (SEC), incluindo, entre outros, seu relatório anual no Formulário 10-K e relatórios trimestrais no Formulário 10-Q.

Cópias dos relatórios apresentados à SEC estão disponíveis no site da empresa e podem ser obtidas gratuitamente junto à NVIDIA. Essas declarações prospectivas não são garantias de desempenho futuro e se referem apenas à data deste documento. Exceto conforme exigido por lei, a NVIDIA se isenta de qualquer obrigação de atualizar essas declarações prospectivas para refletir eventos ou circunstâncias futuras.


Muitos dos produtos e recursos descritos neste documento ainda estão em diferentes estágios de desenvolvimento e serão oferecidos conforme a disponibilidade. As declarações acima não devem ser interpretadas como um compromisso, promessa ou obrigação legal, e o desenvolvimento, lançamento e cronograma de quaisquer recursos ou funcionalidades descritas para nossos produtos estão sujeitos a alterações e permanecem a critério exclusivo da NVIDIA. A NVIDIA não se responsabiliza por falhas ou atrasos na entrega de quaisquer produtos, recursos ou funcionalidades aqui descritos.


© 2026 NVIDIA Corporation. Todos os direitos reservados. NVIDIA, o logotipo da NVIDIA, BlueField, ConnectX, NVIDIA DGX SuperPOD, NVIDIA MGX, NVIDIA Mission Control, NVIDIA Spectrum, NVIDIA Spectrum-X e NVLink são marcas comerciais e/ou marcas registradas da NVIDIA Corporation nos EUA e em outros países. Outros nomes de empresas e produtos podem ser marcas comerciais das respectivas empresas às quais estão associados. Recursos, preços, disponibilidade e especificações estão sujeitos a alterações sem aviso prévio.

Você também pode gostar

Deixe um Comentário

Ao navegar neste site, você aceita os cookies que usamos para melhorar sua experiência. Aceito Mais informações