Red Hat AI 3.4 une desenvolvedores e operadores em torno do futuro agêntico

Red Hat une desenvolvedores e operadores em torno do futuro agêntico com grandes avanços no Red Hat AI 3.4

Novas capacidades “do metal ao agente” no Red Hat AI 3.4 fornecem uma base para escalar modelos e agentes autônomos em toda a nuvem híbrida

ATLANTA – RED HAT SUMMIT – A Red Hat, líder mundial no fornecimento de soluções open source, anunciou avanços significativos em todo o portfólio Red Hat AI para ajudar a reduzir a lacuna entre a experimentação em IA e o controle operacional em nível de produção. Ao entregar uma plataforma unificada “do metal ao agente”, o Red Hat AI 3.4 simplifica o desenvolvimento e a implementação de cargas de trabalho agênticas, permitindo às organizações avançar além dos pilotos para uma IA escalável em toda a sua infraestrutura.

Ao fornecer um framework consistente tanto para desenvolvedores quanto para operadores, a Red Hat oferece uma base para que as organizações escalem sistemas autônomos mantendo o controle, os recursos de segurança e a eficiência de hardware exigidos pela empresa moderna.

O que é o Red Hat AI 3.4?

O Red Hat AI 3.4 é uma plataforma abrangente que entrega a base arquitetônica e as ferramentas operacionais necessárias para escalar modelos e cargas de trabalho em agências em toda a nuvem híbrida. No centro desta versão está a entrega de Model-as-a-Service (MaaS), que fornece uma interface única e governada para que desenvolvedores acessem modelos curados, ao mesmo tempo em que permite aos administradores monitorar o consumo e aplicar políticas. Ela está construída sobre uma base de inferência distribuída de alto desempenho, impulsionada por vLLM e llm-d, para manter a disponibilidade de modelos otimizados e eficientes em uma ampla variedade de ambientes.

À medida que agentes de IA impulsionam uma demanda exponencial por inferência, o Red Hat AI oferece os recursos necessários para que organizações implantem e gerenciem agentes em escala, independentemente do framework utilizado. As novas ferramentas de AgentOps gerenciam agentes desde o desenvolvimento até a produção, com rastreamento integrado, observabilidade, identidade criptográfica e gerenciamento de ciclo de vida.

Para integrar dados corporativos a modelos e agentes, o Red Hat AI 3.4 introduz gerenciamento de prompts — tratando prompts como ativos de dados de primeira classe — e um hub de avaliação para analisar precisão, qualidade e segurança de modelos e agentes. Esses recursos são impulsionados pelo MLflow, que fornece rastreamento integrado de experimentos e gerenciamento de artefatos tanto para casos de uso de IA generativa quanto preditiva. A plataforma capacita usuários a validar a segurança de modelos e agentes com testes automatizados de segurança e simulações de ataque (red teaming) para modelos e agentes, utilizando tecnologia da Chatterbox Labs e do projeto Garak para oferecer um caminho orientado à segurança, desde pilotos experimentais até utilidade corporativa pronta para produção.

Por que o Red Hat AI 3.4 é importante?

A transição de chatbots experimentais para sistemas autônomos prontos para produção exige uma mudança fundamental na forma como as equipes de TI colaboram. Muitas organizações agora reconhecem a necessidade de deixar de ser apenas “consumidoras de tokens” para se tornarem “fornecedoras de tokens”, a fim de gerenciar melhor custos e viabilizar casos de uso de IA privada e soberana. No entanto, o atrito entre desenvolvedores e administradores de infraestrutura continua sendo um dos principais obstáculos à adoção. Sem uma abordagem unificada que alinhe esses dois papéis, barreiras de acesso à infraestrutura desaceleram a inovação, enquanto atalhos de “shadow AI” introduzem riscos sem governança e custos imprevisíveis.

O Red Hat AI 3.4 ajuda a resolver essa tensão ao fornecer uma base corporativa para inferência escalável e implantação de agentes autônomos, entregando a transparência e o controle necessários para atender rigorosos padrões de risco e governança. Como agentes operam com certo nível de independência, a falta de visibilidade sobre sua tomada de decisão cria um risco crítico de segurança. O Red Hat AI aborda isso entregando a infraestrutura necessária para rastrear ações, etapas de raciocínio e chamadas de ferramentas, tornando possível auditar como um agente chegou a determinado resultado. Ao integrar gerenciamento de identidade criptográfica, a plataforma associa ações a uma identidade verificada, ajudando a identificar qual entidade executou a tarefa. Juntas, essas capacidades permitem que organizações avancem além de pilotos desconectados e passem a tratar a IA como um recurso corporativo escalável, previsível e, principalmente, responsável.

O que dizem a Red Hat e seus parceiros

“A era agêntica representa uma evolução da nossa plataforma, que deixa de executar apenas aplicações tradicionais para alimentar sistemas inteligentes e autônomos”, diz Joe Fernandes, vice-presidente e general manager da unidade de negócios de IA da Red Hat. “Estamos definindo o padrão aberto de como empresas executam IA. Ao fornecer uma base robusta, do metal ao agente, para inferência de IA, MaaS e AgentOps, a Red Hat oferece a segurança operacional de que as organizações precisam para inovar em escala mantendo um controle rigoroso.”

“A colaboração da CoreWeave com a Red Hat é baseada em um compromisso compartilhado com a abertura e com a entrega de uma base de inferência de alto desempenho que permite às empresas escalar suas cargas de trabalho de IA mais complexas”, diz Urvashi Chowdhary, vice-presidente de Gerenciamento de Produto – Serviços de IA da CoreWeave. “Juntos, entregamos um modelo de implantação para o Red Hat AI Inference no CoreWeave Kubernetes Service, permitindo executar a mesma stack de inferência tanto on-premises quanto na nuvem, com controle nativo de Kubernetes e desempenho de nível produtivo. Isso permite que equipes corporativas de IA em indústrias reguladas foquem no que realmente importa: construir e escalar IA, sem precisar reformular toda a stack a cada novo ambiente.”

“Agentes autônomos e de longa duração em ambientes corporativos exigem um novo nível de controle de infraestrutura e segurança para garantir operações confiáveis em escala”, diz John Fanelli, vice-presidente de Enterprise Software da NVIDIA. “O Red Hat AI Factory com NVIDIA oferece uma base unificada, impulsionada por open source, que fornece a desenvolvedores e operadores a governança e a confiança necessárias para o futuro agêntico.”

Principais destaques

Inferência escalável e de alto desempenho combinada com acesso governado a modelos: a inferência eficiente de modelos continua sendo o núcleo da IA pronta para produção. Ao combinar o servidor de inferência vLLM e o mecanismo de inferência distribuída llm-d com MaaS, o Red Hat AI 3.4 fornece uma base confiável e de alto desempenho para inferência de modelos, ao mesmo tempo em que simplifica o acesso governado a modelos para usuários e agentes.
AgentOps simplificado para o ciclo de vida de aplicações autônomas: o Red Hat AI 3.4 introduz capacidades abrangentes de AgentOps para ajudar a operacionalizar agentes em escala. Isso inclui rastreamento integrado, observabilidade e avaliações, além de gerenciamento de identidade e ciclo de vida dos agentes para levá-los do desenvolvimento à produção.
Conectando dados a modelos e agentes: dados corporativos são o combustível que impulsiona modelos e agentes. O Red Hat AI 3.4 adiciona gerenciamento de prompts, tratando prompts como ativos de dados de primeira classe, e um hub de avaliação para gerenciar análises de qualidade, precisão, segurança e risco. Esses recursos são impulsionados pelo MLflow, que também fornece rastreamento integrado de experimentos e gerenciamento de artefatos para casos de uso tanto de IA generativa quanto de IA/ML preditiva.

Segurança integrada para modelos e agentes: para ajudar a proteger toda a stack de IA, o Red Hat AI oferece uma postura de segurança em camadas que se estende do sistema operacional à lógica agêntica. Ao fornecer testes automatizados de segurança e red teaming, as organizações podem adotar uma abordagem orientada por dados para seleção e configuração de modelos e guardrails, ajudando a proteger cargas de trabalho de IA contra ameaças em constante evolução.

Mais detalhes sobre o Red Hat AI 3.4

Inferência avançada e otimização de modelos: o Red Hat AI Inference adiciona priorização de requisições às suas capacidades de inferência distribuída, permitindo que tráfego interativo e em segundo plano compartilhem o mesmo endpoint, enquanto solicitações sensíveis à latência são processadas primeiro sob carga. O Red Hat AI Inference também se expande além do Red Hat OpenShift para serviços adicionais de Kubernetes, incluindo CoreWeave e Azure, oferecendo às organizações uma stack de inferência consistente em diferentes ambientes. O suporte a decodificação especulativa, agora disponível, melhora a velocidade das respostas em 2x–3x com impacto mínimo na qualidade, ao mesmo tempo em que reduz o custo por interação.

Model-as-a-Service (MaaS) governado: esse recurso permite que engenheiros de plataforma entreguem modelos curados e validados por meio de endpoints de API com segurança aprimorada, utilizando interfaces padrão compatíveis com OpenAI. Isso possibilita uma governança unificada tanto de modelos internos quanto de APIs externas, integrada à autenticação baseada em provedores de identidade (IDP).

Gerenciamento integrado de prompts: a plataforma fornece ferramentas unificadas para criar e gerenciar prompts como ativos de dados de primeira classe. Armazenar as entradas que impulsionam modelos e agentes em um registro central oferece uma única fonte de verdade tanto para desenvolvedores quanto para administradores.
Avaliações automatizadas para modelos e agentes: o Red Hat AI 3.4 introduz o hub de avaliação, um plano de controle unificado e agnóstico a frameworks para avaliar grandes modelos de linguagem (LLMs), aplicações de IA e agentes. Isso substitui métodos fragmentados de testes por uma abordagem unificada para benchmarking de qualidade, precisão e risco.

Segurança multicamadas: o escaneamento automatizado adversarial agora está integrado diretamente ao ciclo de vida de desenvolvimento. Aproveitando a tecnologia da Chatterbox Labs, a plataforma Red Hat AI utiliza Garak para analisar modelos e sistemas agênticos em busca de riscos como jailbreaks, prompt injections e vieses, em conjunto com NVIDIA NeMo Guardrails para segurança em tempo de execução.

Observabilidade pronta para produção: a integração do MLflow fornece visibilidade sobre a execução dos agentes, permitindo rastreamento de ponta a ponta de chamadas de LLM, etapas de raciocínio, execução de ferramentas, respostas de modelos e uso de tokens via OpenTelemetry. Isso cria uma trilha de auditoria transparente para todo o ciclo de vida de prompts, embeddings e configurações de RAG, apoiando depuração e auditoria. 
O MLflow também oferece rastreamento integrado de experimentos e gerenciamento de artefatos para casos de uso de IA generativa e IA preditiva.

Governança baseada em identidade: utilizando gerenciamento criptográfico de identidade (SPIFFE/SPIRE), o Red Hat AI permite que organizações substituam chaves estáticas codificadas por tokens de curta duração. Isso apoia operações de privilégio mínimo para agentes autônomos em toda a stack e ajuda a garantir que ações agênticas estejam vinculadas a uma identidade verificada.

Experiências automatizadas: ferramentas como AutoRAG e AutoML automatizam tarefas complexas de IA, desde a seleção das estratégias de recuperação mais eficazes para conjuntos de dados específicos até a criação e otimização de modelos preditivos tradicionais.

Flexibilidade de hardware e nuvens gerenciadas: o Red Hat AI 3.4 oferece suporte de dia zero para GPUs NVIDIA Blackwell e arquiteturas AMD MI325X. Ao expandir essa arquitetura unificada de plataforma para execução nativa em nuvens gerenciadas de terceiros — incluindo o novo Red Hat AI Inference on IBM Cloud — a Red Hat fornece consistência operacional em uma ampla gama de provedores de hardware e nuvem.

Disponibilidade do Red Hat AI 3.4

O Red Hat AI 3.4 deve estar disponível ainda este mês.

Sobre a Red Hat

A Red Hat é líder em tecnologia de nuvem híbrida aberta, e proporciona uma base confiável, consistente e abrangente para uma inovação transformadora em TI e aplicações de inteligência artificial (IA). Seu portfólio de tecnologias de nuvem, desenvolvimento, IA, Linux e automação permite a implementação de qualquer aplicação, em qualquer lugar, desde data centers até a edge. Como líder mundial no fornecimento de soluções de software open source empresarial, a Red Hat investe em ecossistemas e comunidades abertas para resolver os desafios de TI do futuro. Por meio da colaboração, a Red Hat ajuda clientes e parceiros a construir, conectar, automatizar, proteger e gerenciar seus ambientes de TI, com o suporte de serviços de consultoria, treinamento e certificação reconhecidos mundialmente.

Red Hat AI 3.4 une desenvolvedores e operadores em torno do futuro agêntico

Red Hat une desenvolvedores e operadores em torno do futuro agêntico com grandes avanços no Red Hat AI 3.4

O que é o Red Hat AI 3.4?

Por que o Red Hat AI 3.4 é importante?

O que dizem a Red Hat e seus parceiros

Mais detalhes sobre o Red Hat AI 3.4

Disponibilidade do Red Hat AI 3.4

Sobre a Red Hat

TecnoSpeed entre as 300 empresas que mais crescem na América

Itens de smart home apresentam crescimento na procura

Você também pode gostar

Deixe um Comentário Cancelar Resposta