A Meta revelou oficialmente a série Llama 4, formada pelos modelos Scout, Maverick e o futuro Behemoth. Essa nova geração utiliza a técnica Mixture of Experts (MoE), que ativa apenas os parâmetros necessários, reduzindo o custo computacional e aumentando a eficiência. A estratégia da empresa visa atender à crescente demanda por soluções de IA generativa mais rápidas, escaláveis e com maior capacidade de personalização.
O Llama 4 Scout opera com 17 bilhões de parâmetros ativos e suporte a contextos com até 10 milhões de tokens, sendo ideal para análise de documentos longos e síntese de códigos. Já o Maverick, com a mesma quantidade de parâmetros, conta com 128 especialistas e se destaca em tarefas multilíngues e assistentes virtuais, superando concorrentes como o GPT-4.0 e o Gemini 2.0 em raciocínio lógico e codificação. Ambos os modelos podem ser executados com uma única GPU Nvidia H100, facilitando a adoção por empresas menores.
Ainda em desenvolvimento, o modelo Behemoth promete 288 bilhões de parâmetros ativos e integração multimodal avançada via “early fusion”, combinando texto, imagem, vídeo e áudio. Os modelos Scout e Maverick já estão disponíveis para download, mas o uso comercial por empresas com mais de 700 milhões de usuários requer aprovação específica da Meta. Restrições na União Europeia ainda limitam sua aplicação local. Mais novidades serão reveladas na LlamaCon, em 29 de abril.