NVIDIA e OpenAI trazem modelos avançados de IA para PCs com GeForce RTX

A NVIDIA anunciou uma parceria com a OpenAI para disponibilizar modelos avançados de inteligência artificial diretamente em computadores equipados com placas GeForce RTX. Antes restrita a data centers, a tecnologia agora poderá ser executada localmente, oferecendo desempenho elevado em PCs e estações de trabalho.

Dois modelos estão disponíveis: o gpt-oss-20b, otimizado para máquinas com pelo menos 16 GB de memória de vídeo e capaz de processar até 250 tokens por segundo na GPU RTX 5090; e o gpt-oss-120b, voltado para estações de trabalho com GPUs RTX PRO. Ambos suportam até 131 mil tokens de contexto e utilizam arquitetura mixture-of-experts, que permite maior eficiência no processamento.

Os modelos, treinados com GPUs NVIDIA H100, também são os primeiros compatíveis com a técnica MXFP4 na plataforma RTX, que melhora a precisão sem perda de desempenho.

O fundador e CEO da NVIDIA, Jensen Huang, destacou a importância desse lançamento: “A OpenAI mostrou ao mundo o que poderia ser construído com a IA da NVIDIA, e agora estão impulsionando a inovação em software de código aberto,” disse Jensen. “Os modelos gpt-oss permitem que desenvolvedores do mundo todo construam sobre essa base de código aberto de última geração, fortalecendo a liderança tecnológica dos EUA em IA, tudo isso sobre a maior infraestrutura de computação de IA do mundo”, completou o CEO.

Para acesso, usuários podem recorrer ao aplicativo Ollama, que oferece suporte nativo aos novos modelos; à ferramenta Llama.cpp, otimizada para GPUs RTX em colaboração com a comunidade de código aberto; ou ao Microsoft AI Foundry Local, disponível em versão de testes no Windows.

Para mais informações sobre a colaboração entre a NVIDIA e a OpenAI, visite o blog corporativo da NVIDIA.