Home Artigos HeatWave GenAI a nova LLMs da Oracle

HeatWave GenAI a nova LLMs da Oracle

por Paulo Fernandes Maciel

Oracle anuncia LLMs no banco de dados e armazenamento vetorial automatizado com o HeatWave GenAI

A Oracle anunciou a disponibilidade geral do HeatWave GenAI, que inclui os primeiros modelos de linguagem de grande escala (LLMs) no banco de dados do setor, um armazenamento vetorial automatizado no banco de dados, processamento vetorial em expansão e a capacidade de ter conversas contextuais em linguagem natural informadas por conteúdo não estruturado.


Esses novos recursos permitem que clientes tragam o poder da IA generativa para seus dados corporativos sem precisar de experiência em IA ou de ter que mover dados para um banco de dados vetorial separado. O HeatWave GenAI já está disponível em todas as regiões do Oracle Cloud, na região dedicada do Oracle Cloud Infrastructure (OCI) e em nuvens sem custo extra para os clientes do HeatWave.

Clientes podem criar aplicativos de IA generativa sem ter experiência em IA, movimentação de dados ou custo adicional

Com o HeatWave GenAI, os desenvolvedores podem criar um repositório vetorial para conteúdo corporativo com um único comando SQL, usando modelos de incorporação internos. Os usuários também podem realizar pesquisas em uma única etapa usando LLMs internos ou externos. Os dados não saem do banco de dados e, devido à escala e desempenho do HeatWave, não há necessidade de provisionar GPUs. Como resultado, os desenvolvedores podem reduzir a complexidade do aplicativo, aumentar o desempenho, melhorar a segurança dos dados e reduzir os custos.

HeatWave GenAI


“O impressionante ritmo de inovação do HeatWave continua com a adição do HeatWave GenAI aos recursos integrados existentes do HeatWave: HeatWave Lakehouse, HeatWave Autopilot, HeatWave AutoML e HeatWave MySQL”, comenta Edward Screven, arquiteto-chefe corporativo da Oracle. “Os aprimoramentos de IA integrados e automatizados de hoje permitem que os desenvolvedores criem aplicativos de IA generativos avançados mais rapidamente, sem exigir experiência em IA ou mover dados. Os usuários agora têm uma maneira intuitiva de interagir com seus dados corporativos e obter rapidamente as respostas precisas de que precisam para seus negócios”.


“O HeatWave GenAI torna extremamente fácil tirar proveito da IA generativa”, completa Vijay Sundhar, CEO da SmarterD, plataforma de gerenciamento de segurança cibernética. “O suporte para LLMs no banco de dados e criação de vetores no banco de dados leva a uma redução significativa na complexidade do aplicativo, latência de inferência e, acima de tudo, nenhum custo adicional para usar os LLMs ou criar as incorporações. Esta é realmente a democratização da IA generativa e acreditamos que resultará na construção de aplicativos ainda melhores e em ganhos significativos de produtividade para nossos clientes”.


Os novos recursos de IA generativa automatizados e integrados incluem:Os LLMs no banco de dados simplificam o desenvolvimento de aplicativos de IA generativa a um custo mais baixo. Os clientes podem se beneficiar da IA generativa sem a complexidade da seleção e integração de LLM externo e sem se preocupar com a disponibilidade de LLMs em data centers de vários provedores de nuvem.

Geraçao de dados e conteúdos

Os LLMs no banco de dados permitem que os clientes pesquisem dados, gerem ou resumam conteúdos e executem a geração aumentada de recuperação (RAG) com o HeatWave Vector Store. Além disso, eles podem combinar IA generativa com outros recursos HeatWave integrados, como o AutoML, para criar aplicativos mais completos. O HeatWave GenAI também está integrado ao serviço OCI Generative AI para acessar modelos pré-treinados dos principais provedores de LLM.

O Automated In-database Vector Store permite que os clientes usem IA generativa com seus documentos de negócios sem mover dados para um banco de dados vetorial separado e sem experiência em IA. Todas as etapas para criar um repositório vetorial e incorporações vetoriais são automatizadas e executadas dentro do banco de dados, incluindo localizar documentos no armazenamento, analisá-los, gerar incorporações de forma altamente paralela e otimizada e inseri-los no armazenamento vetorial, tornando o HeatWave Vector Store eficiente e fácil de usar.

O processamento vetorial de expansão fornece resultados de pesquisa semântica muito rápidos sem qualquer perda de precisão. O HeatWave suporta um novo tipo de dados VECTOR nativo e uma implementação otimizada da função, permitindo que os clientes realizem consultas com SQL padrão. A representação híbrida na memória e a arquitetura scale-out do HeatWave permitem que o processamento vetorial seja executado em largura de banda próxima à memória. Como resultado, os clientes têm suas perguntas respondidas rapidamente. Os usuários também podem combinar a pesquisa semântica com outros operadores SQL para, por exemplo, unir várias tabelas com documentos diferentes e executar pesquisas de similaridade em todos os documentos.

O HeatWave Chat é um plug-in de código visual para MySQL Shell que fornece uma interface gráfica para o HeatWave GenAI e permite que os desenvolvedores façam perguntas em linguagem natural ou linguagem de consulta estruturada (SQL). O Lakehouse Navigator integrado permite que os usuários selecionem arquivos do armazenamento de objetos e criem um repositório vetorial. Os usuários podem pesquisar em todo o banco de dados ou restringir a pesquisa a uma pasta. O HeatWave Chat mantém o contexto com o histórico de perguntas feitas, citações dos documentos de origem e o prompt para o LLM. Isso facilita uma conversa contextual e permite que os usuários verifiquem a fonte das respostas geradas pelo LLM. Esse contexto é mantido no HeatWave e está disponível para qualquer aplicativo que use o HeatWave.

Criação de Vector Store e benchmarks de processamento vetorial


Criar um repositório vetorial para documentos nos formatos PDF, PPT, Word e HTML é até 23 vezes mais rápido com o HeatWave GenAI e com 1/4 do custo de uso da base de conhecimento comparado ao Amazon Bedrock.
Como demonstrado por um benchmark e usando uma variedade de consultas de pesquisa de similaridade em tabelas que variam de 1,6 GB a 300 GB de tamanho, o HeatWave GenAI é 30 vezes mais rápido que o Snowflake e custa 25% menos; 15 vezes mais rápido que o Databricks e custa 85% menos; e 18 vezes mais rápido que o Google BigQuery e custa 60% menos.
Um outro benchmark revela que os índices vetoriais no Amazon Aurora PostgreSQL com pgvector podem ter um alto grau de imprecisão e produzir resultados incorretos. Em contraste, o processamento de pesquisa de similaridade do HeatWave sempre fornece resultados precisos, tem tempo de resposta previsível, é executado em velocidade próxima à memória e é até 10 a 80 vezes mais rápido do que o Aurora usando o mesmo número de núcleos.
“Estamos entusiasmados em continuar nossa forte colaboração com a Oracle para fornecer o poder e a produtividade da IA com o HeatWave GenAI para cargas de trabalho e conjuntos de dados corporativos críticos”, ressalta Dan McNamara, vice-presidente sênior e gerente geral da Unidade de Negócios de Servidores da AMD, fabricante de processadores e placas de vídeo. “O trabalho conjunto de engenharia realizado pela AMD e pela Oracle está permitindo que os desenvolvedores projetem soluções inovadoras de IA corporativa, aproveitando o HeatWave GenAI alimentado pela densidade do núcleo e pelo excelente desempenho de preço dos processadores AMD EPYC”.

Comentários adicionais de clientes e analistas sobre o HeatWave GenAI

“Usamos o HeatWave AutoML no banco de dados para fazer recomendações aos nossos clientes”, comenta Safarath Shafi, CEO da EatEasy, plataforma que oferece refeições saudáveis, entregues diretamente ao consumidor. “O suporte do HeatWave para LLMs no banco de dados e armazenamento vetorial no banco de dados é diferenciado, e a capacidade de integrar IA generativa com AutoML fornece mais diferenciação para o HeatWave na indústria, permitindo-nos oferecer novos tipos de recursos aos nossos clientes. A sinergia com o AutoML também melhora o desempenho e a qualidade dos resultados do LLM”.


“Os LLMs no banco de dados HeatWave, o armazenamento vetorial no banco de dados, o processamento vetorial na memória scale-out e o HeatWave Chat são recursos muito diferenciados da Oracle que democratizam a IA generativa e a tornam simples, segura e barata de usar”, destaca Eric Aguilar, fundador da Aiwifi, fornecedora de soluções de internet sem fio e de alta performance. “Usar o HeatWave e o AutoML para nossas necessidades corporativas já transformou nossos negócios de várias maneiras, e a introdução dessa inovação da Oracle estimulará o crescimento de uma nova classe de aplicativos”.


“A inovação de engenharia do HeatWave continua a entregar a visão de um banco de dados universal em nuvem”, observa Holger Mueller, vice-presidente e analista principal da Constellation Research, empresa de pesquisa e consultoria focada em transformação digital. “A mais recente é a IA generativa feita no ‘estilo HeatWave’ – que inclui a integração de um armazenamento vetorial automatizado no banco de dados e LLMs no banco de dados diretamente no núcleo do HeatWave. Isso permite que os desenvolvedores criem classes de aplicativos à medida que combinam elementos HeatWave.

Por exemplo, eles podem combinar o HeatWave AutoML e o HeatWave GenAI em um aplicativo de detecção de fraude que não apenas detecta transações suspeitas, mas também fornece uma explicação compreensível. Isso tudo é executado no banco de dados, portanto, não há necessidade de mover dados para bancos de dados vetoriais externos, mantendo os dados mais seguros”.

HeatWave


O HeatWave é o único serviço de nuvem que fornece IA generativa automatizada e integrada com machine learning em uma oferta única para transações e análises em lagoa de dados (Data Lake). Componente central da estratégia de nuvem distribuída da Oracle, o HeatWave está disponível nativamente no OCI e Amazon Web Services, no Microsoft Azure por meio do Oracle Interconnect for Azure, e nos data centers dos clientes com OCI Dedicated Region e Oracle Alloy.

Recursos adicionais
  1. Assista ao anúncio de Edward Screven sobre novos aprimoramentos GenAI para HeatWave
  2. Leia o blog do HeatWave com informações técnicas
  3. Leia o que os analistas do setor estão dizendo sobre o HeatWave

Sobre a Oracle


A Oracle oferece conjuntos integrados de aplicações, além de uma estrutura segura e autônoma na Oracle Cloud. Para obter mais informações sobre a Oracle (NYSE: ORCL), acesse www.oracle.com.Marcas registradas

Marcsas


Oracle, Java, MySQL e NetSuite são marcas registradas da Oracle Corporation. A NetSuite foi a primeira empresa de nuvem, inaugurando a nova era da computação em nuvem.

Você também pode gostar

Deixe um Comentário

Ao navegar neste site, você aceita os cookies que usamos para melhorar sua experiência. Aceito Mais informações