A próxima geração da Siri, prevista para chegar em setembro, não dependerá exclusivamente da tecnologia da Apple. A empresa estabeleceu um acordo com a NVIDIA para o processamento de parte das consultas na nuvem. A nova versão do assistente virtual tem estreia planejada para a WWDC 2026, com o objetivo de reduzir a distância em relação a concorrentes como ChatGPT e Claude.
Segundo informações do veículo The Information, a Apple planeja lançar a versão aprimorada da Siri com o suporte dos servidores do Google Cloud, que, por sua vez, operam com os chips Blackwell B200 da NVIDIA. Essa decisão se deve às limitações da infraestrutura própria da Apple em suportar a versão completa do modelo Gemini que será utilizada pelo assistente.
Anteriormente, a Apple tentou integrar o Gemini em seu sistema de servidores internos, o Private Cloud Compute, baseado em Apple Silicon. No entanto, os resultados apresentaram lentidão excessiva para um produto voltado ao consumidor. O Gemini, em sua totalidade, gerencia trilhões de parâmetros e exige uma capacidade de processamento que os servidores da Apple não conseguem fornecer na velocidade necessária.
Para manter seus padrões de privacidade ao processar dados em infraestruturas externas, a Apple implementará a funcionalidade de computação confidencial da NVIDIA. Este recurso garante a criptografia dos dados e dos modelos de IA durante o processamento nos chips, permitindo que a empresa mantenha um certo nível de controle sobre a privacidade do usuário, mesmo com as consultas sendo encaminhadas para os data centers do Google. Essa camada adicional de segurança poderá impactar minimamente a velocidade de processamento, mas de forma menos acentuada do que se os dados fossem executados em servidores da Apple.
Siri Também Utilizará uma Versão do Gemini Executada no iPhone
A parceria com Google e NVIDIA não significa que a Apple tenha abandonado sua visão de inteligência artificial no dispositivo. A empresa está trabalhando em paralelo para reduzir o tamanho do modelo Gemini, permitindo que ele seja executado diretamente em iPhones, iPads e Macs. Esse processo técnico é conhecido como destilação. A Apple também está avaliando a aquisição de startups especializadas nesse segmento, como a Liquid AI, focada na execução local de modelos de IA.
A ideia de que a Siri execute modelos de IA no próprio iPhone não se limita à questão da privacidade. O processamento de consultas diretamente no dispositivo contribui para a redução dos custos com infraestrutura de data centers, algo crucial para a Apple e outras empresas de tecnologia na era da IA. Como exemplo, a Meta destinou 72 bilhões de dólares em despesas de capital para 2025, enquanto a Microsoft alcançou 88 bilhões.
A combinação de processamento local para consultas rotineiras e o uso da nuvem para tarefas mais complexas parece ser o modelo definitivo que a Apple pretende estabelecer. Para os usuários, isso se traduzirá em uma Siri com maior contexto, melhor compreensão da linguagem natural e, de acordo com a Apple, maiores garantias de privacidade em comparação com soluções puramente baseadas na nuvem.
A nova Siri será anunciada na próxima semana durante a WWDC 2026, com o lançamento oficial da versão aprimorada do assistente em setembro. A promessa é de uma experiência mais personalizada e conversacional, bastante distinta da assistente que os usuários de iPhone conhecem há anos.
