por
Nickolas Lobo
Paula Zogbi
8 min
-
Publicado em
28/3/2025
Para o CEO da Nvidia, Jensen Huang, agora estamos entrando em uma nova fase: a da IA agêntica. Nesta evolução, os sistemas não apenas geram respostas, como também raciocinam, planejam e agem.
A A IA agêntica assume que os modelos decomponham problemas em etapas, verifiquem sua própria lógica e até usem ferramentas externas. A superação dessa fronteira é amplamente aguardada pelo mercado, e um dos motivos pelos quais as chamadas hyperscalers vêm investindo altíssimas quantias em tecnologias relacionadas.
Neste conteúdo, vamos explicar como essa nova fronteira da IA renovou a visão do mercado para a Nvidia, uma das maiores empresas do mundo. Também discutimos as principais inovações apresentadas pela companhia durante o gtc 2025 — evento focado em desenvolvedores que aconteceu entre 17 e 21 de março — e como elas afetam os setores de farmácia e saúde, semicondutores e automotivo.
Para que a progressão esperada rumo a IA agêntica seja atingida de fato, será necessário o uso de 100 vezes mais poder computacional do que o previsto anteriormente, de acordo com Huang. Isto porque o raciocínio envolve gerar milhares de tokens intermediários, cada um exigindo que o modelo reprocesse toda a sua base de conhecimento.
A demonstração foi feita com um desafio de arranjo de assentos de casamento:
Além do raciocínio digital, Huang introduziu o que foi chamado de “a próxima fronteira”, a IA física, em que os modelos têm compreensão da física do mundo real (fricção, inércia, permanência de objetos). Esta é a base para:
Nesse mundo de IA física entra a plataforma Omniverse da NVIDIA, um recurso digital onde a IA pode treinar antes de interagir com o mundo real, facilitando o processo e encurtando o tempo de treinamento e barateando os custos.
Neste contexto, o GTC 2025 não afetou a visão do mercado para a Nvidia de maneira substancial, porque parte do que foi apresentado já vinha sendo incorporado nas expectativas de longo prazo dos investidores. Mesmo assim, ajudou a dissipar parte das preocupações em torno do tamanho de mercado após o episódio da DeepSeek, uma vez que modelos de raciocínio exigem muito mais capacidade computacional do que um modelo de AI pré-treinado. Além disso, a progressão de inovação e produtividade parece estar trazendo um futuro tecnologicamente “utópico” mais próximo da realidade atual.
Contudo, nem só de futuro vive a tese. Entre os dados mais emblemáticos apresentados está a forte tração inicial do Blackwell, modelo de GPU mais atual da companhia. Em 2024, a Nvidia enviou 1,3 milhão de chips Hopper para os 4 principais provedores de Cloud (computação de nuvem) dos EUA. Em contraponto, até o momento, em 2025, 3,6 milhões de chips Blackwell foram enviados para os mesmos 4 clientes, sendo 1,8 milhão de novos pedidos (desconsiderando entregas atrasadas do ano passado) — ou seja, até março, foram entregues 40% mais chips do que todo 2024.
Por fim, além da forte demanda, outro fator que gera suporte de longo prazo para a companhia, com um grande diferencial comparativo, são os saltos geracionais no desempenho, com uma capacidade de inferência 40x maior do Blackwell em comparação com o Hopper (versão anterior).
Neste sentido, separamos alguns destaques citados na conferência:
A peça central da infraestrutura de AI da NVIDIA é o GPU Blackwell, agora em produção total. De acordo com Jensen, o Blackwell não é apenas uma atualização incremental: é uma mudança fundamental no conceito de escala computacional para IA.
Com o discurso do CEO, ficou evidente que a Nvidia está construindo um ecossistema de IA completo para diferentes mercados. Os principais provedores de Cloud dos EUA (AWS, Azure, GCP, OCI) seguem mostrando uma demanda crescente com os dados do Blackwell. Além disso, novas parcerias foram anunciadas com Cisco, T-Mobile e Cerberus para construir redes 5G alimentadas por IA — A ideia é que os sistemas de telecomunicações futuros usarão IA para otimizar sinais em tempo real.
A maior novidade e mais empolgante foi o anúncio da IA incorporada partindo da abordagem de modelos aplicando princípios físicos para o treinamento de robôs e carros autônomos, por exemplo.
A Nvidia anunciou uma grande colaboração com a General Motors para desenvolver frotas de veículos autônomos (VAs) movidos a IA. incluindo:
A Nvidia também destacou sua plataforma Halo, o primeiro sistema de segurança para VAs com foco na segurança de algoritmo. Além disso, implementará o Omniverse & Cosmos no treinamento, replicando cidades, tráfego e clima com treinamento de circuito fechado, com milhões de cenários simulados antes de ir para a estrada, e simulando situações raras e perigosas (por exemplo: travessias repentinas de pedestres).
A ideia parte da abordagem de que os modelos de IA estão evoluindo da percepção para o raciocínio, então, a abordagem antiga, com os VAs dependendo de IA de percepção (detecção de objetos) será substituída pela previsão do comportamento humano, com planejamento de longo prazo.
A Inteligência Artificial está remodelando alguns fundamentos de processos nos setores de saúde e farmácia por meio de avanços na descoberta de medicamentos, imagens médicas, genômica e aplicações clínicas. A ideia parte da mesma lógica de incremento de produtividade, aumentando a velocidade de pesquisas e desenvolvimento de novas drogas e até eliminando potencial de erro humano.
A Nvidia conta com a plataforma BioNeMo, que agora incorpora modelos de linguagem grandes sofisticados projetados especificamente para aplicações de biologia molecular, contando com previsão de estruturas de proteínas, simulação de interações droga-alvo e otimização de compostos moleculares com velocidade e precisão. Empresas farmacêuticas líderes, como a Amgen, já estão aproveitando essas ferramentas para comprimir drasticamente os cronogramas de desenvolvimento de medicamentos, que tradicionalmente abrangiam décadas.
As imagens médicas e os diagnósticos também podem ser beneficiadas pelo MONAI (Medical Open Network for AI) da Nvidia, que é uma plataforma de código open source preeminente para imagens médicas aprimoradas por IA. A plataforma auxilia na detecção de tumores, análise radiológica, diagnósticos automatizados e auxílio em procedimentos mais complexos com várias aplicações já aprovadas pelo FDA.
Talvez uma das aplicações mais visionárias venha por meio da plataforma Omniverse. Hospitais estão usando essas réplicas virtuais para otimizar o fluxo de pacientes, prever as necessidades de capacidade da unidade de terapia intensiva e até treinar sistemas cirúrgicos robóticos em ambientes simulados sem risco. Empresas farmacêuticas estão dando um passo adiante, realizando ensaios clínicos virtuais que podem modelar perfis de eficácia e segurança de medicamentos antes mesmo de administrar compostos a seres humanos.
A revolução da robótica também está chegando à saúde por meio da plataforma GR00T, originalmente desenvolvida para robôs humanóides de uso geral, mas agora sendo adaptada para aplicações médicas. As primeiras implementações incluem assistentes robóticos para cuidados com idosos, terapias de reabilitação e automação de laboratório, com aplicações futuras prevendo assistentes cirúrgicos e robôs de logística hospitalar. Complementando esses sistemas físicos estão assistentes de enfermagem de IA avançados — sistemas de chatbot sofisticados alimentados por modelos de linguagem grandes que podem lidar com triagem de pacientes, gerenciamento de doenças crônicas e até suporte à saúde mental.
É fato que a indústria de semicondutores está em um ponto de inflexão. Várias mudanças fundamentais estão surgindo para remodelar a dinâmica competitiva, os roteiros tecnológicos e as estruturas de mercado nos próximos anos.
A demanda deve continuar sendo impulsionada e as arquiteturas especializadas para cada propósito devem continuar se expandindo. Essa transição, por sua vez, potencialmente favorece também empresas de semicondutores que podem fornecer soluções construídas para fins específicos, combinando silício avançado com ecossistemas de software completo.
A eficiência energética segue sendo um grande ponto de interrogação na progressão do desenvolvimento, uma vez que, à medida que os modelos de AI crescem exponencialmente em tamanho e complexidade, as restrições de potência de design térmico estão forçando inovações radicais em embalagens de chips, soluções de resfriamento e design de arquitetura. Os futuros vencedores da indústria serão aqueles que puderem fornecer a maior densidade computacional dentro dos limites energéticos.
A cadeia de valor dos semicondutores está passando por uma profunda reestruturação, à medida que os hyperscalers e os grandes fabricantes de hardware (OEMs), exigem soluções mais personalizadas. Isso está impulsionando o aumento da concorrência entre os fornecedores tradicionais de semicondutores comerciais e os programas de silício personalizados, ao mesmo tempo em que cria oportunidades para designs modulares que podem equilibrar a personalização com as economias de escala.
A rápida progressão da Inteligência Artificial (IA) na última década se tornou um dos grandes temas de discussão global e fez preço no mercado. Primeiro, a chamada IA de percepção possibilitou avanços na visão computacional e no reconhecimento de fala; na sequência, especialmente os últimos cinco anos foram dominados pela IA generativa, com a produção de textos e a revolução na forma como se busca informação.
Nickolas Lobo
Analista de Research da Nomad, com 5 anos de experiência no mercado financeiro, com passagem pela Spectra, Banco Modal e mais de 3 anos trabalhando em equities globais, principalmente no mercado americano, na RXZ Investimentos. É graduado em Economia pelo Insper
Paula Zogbi
Gerente de Research e Head de conteúdo na Nomad, tem mais de 10 anos de experiência no mercado financeiro, foi head de conteúdo na XP, analista na Rico e jornalista na InfoMoney e EXAME. É graduada em jornalismo pela USP e tem certificação CNPI pela Apimec.
Agradecemos seu interesse em receber nossos conteúdos.
Ops! Algo deu errado em sua inscrição. Por favor, tente novamente.