O sistema multi-agente do Coral Protocol superou o Magnetic-UI apoiado pela Microsoft em 34% no GAIA Benchmark, demonstrando que a orquestração inteligente de modelos menores pode rivalizar ou superar abordagens tradicionais de IA em grande escala.
Infraestrutura descentralizada para IA colaborativa, o Coral Protocol relatou que seu sistema multiagente superou o Magnetic-UI apoiado pela Microsoft em 34% no GAIA Benchmark—um resultado sem precedentes que sugere que a escalabilidade horizontal pode oferecer uma abordagem mais eficaz do que a expansão dos parâmetros do modelo. O sistema do protocolo aproveita a orquestração inteligente entre múltiplos agentes, em vez de se concentrar apenas no aumento do tamanho do modelo.
Este desempenho marcou a maior pontuação verificada no GAIA Benchmark utilizando mini agentes, apoiando a premissa da NVIDIA de que modelos menores bem coordenados poderiam desempenhar um papel crucial no futuro da IA. O resultado, segundo os desenvolvedores da Coral, reflete uma mudança conceptual na abordagem da escalabilidade da IA, em vez de um mero aumento no poder do sistema.
Como um protocolo aberto, o Coral facilita a expansão das capacidades de IA ao permitir a coordenação entre agentes especializados globalmente, em vez de depender de modelos gerais centralizados. Sua arquitetura permite a interação paralela e segura entre agentes, melhorando a funcionalidade dos modelos de linguagem de todos os tamanhos em tarefas que requerem raciocínio avançado, planejamento e resolução de problemas.
“Este avanço marca um ponto de viragem na infraestrutura de IA,” disse Caelum Forder, CTO da Coral, em um comunicado escrito. “É prova de que a escalabilidade horizontal não é apenas possível—é prática, e a Coral é a forma mais eficaz de o fazer. A Internet dos Agentes é agora uma realidade em funcionamento. Se você é um desenvolvedor de agentes, basta Coralise. Se você é um desenvolvedor de aplicações, construa melhor por menos usando a nossa infraestrutura,” acrescentou.
Coral Tops GAIA Benchmark, Valida o Poder de Modelos Pequenos em Sistemas Agenticos Avançados
Num cenário de crescente concorrência para desenvolver sistemas agentes avançados, grande parte do foco tem permanecido em escalar modelos para gerenciar a crescente complexidade das tarefas. O desempenho recente do Coral desafia essa abordagem predominante, alinhando-se com as descobertas de um estudo recente da NVIDIA que sugere que sistemas menores podem oferecer alto desempenho sem comprometer velocidade, segurança ou eficiência. O GAIA Benchmark, um conjunto de avaliações abrangente para IA avançada, foi projetado para avaliar quão bem os sistemas lidam com tarefas do mundo real que normalmente exigiriam tempo e habilidades substanciais de especialistas humanos. Composto por 450 prompts complexos que testam capacidades de pesquisa, análise e raciocínio, o benchmark serve como uma métrica chave da indústria para avaliar a eficácia de modelos de linguagem de propósito geral (LLM) agentes.
O Sistema de Agentes GAIA da Coral, utilizado no teste de referência, é baseado no Protocolo Coral e inspira-se nos princípios de design do OWL da CAMEL. Incorpora agentes especializados para realizar uma variedade de tarefas, incluindo pesquisa, análise, crítica, planejamento e navegação na web, todas as quais se comunicam através da infraestrutura de servidor MCP da Coral.
Liderar o ranking GAIA Benchmark para modelos menores indica o potencial do Coral para estender a funcionalidade dos sistemas de IA através de uma estrutura baseada em gráficos. Este resultado sugere que agentes leves e de alto desempenho podem ser criados usando modelos menores—facilitando um manuseio de dados mais amplo, uma integração mais suave no ecossistema e uma comunicação aprimorada entre agentes.
“O papel dos pequenos modelos em sistemas agentes tem sido subestimado até agora, mas as marés estão começando a mudar,” disse Caelum Forder. “Provamos que tais modelos podem escalar além de seus limites conhecidos anteriormente e superar os incumbentes. Estou confiante de que eles têm um papel central a desempenhar no futuro da IA agente,” concluiu.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
O Coral Protocol supera a Microsoft em 34% com a melhor Referência GAIA para Mini-Modelo de IA
Em Resumo
O sistema multi-agente do Coral Protocol superou o Magnetic-UI apoiado pela Microsoft em 34% no GAIA Benchmark, demonstrando que a orquestração inteligente de modelos menores pode rivalizar ou superar abordagens tradicionais de IA em grande escala.
Infraestrutura descentralizada para IA colaborativa, o Coral Protocol relatou que seu sistema multiagente superou o Magnetic-UI apoiado pela Microsoft em 34% no GAIA Benchmark—um resultado sem precedentes que sugere que a escalabilidade horizontal pode oferecer uma abordagem mais eficaz do que a expansão dos parâmetros do modelo. O sistema do protocolo aproveita a orquestração inteligente entre múltiplos agentes, em vez de se concentrar apenas no aumento do tamanho do modelo.
Este desempenho marcou a maior pontuação verificada no GAIA Benchmark utilizando mini agentes, apoiando a premissa da NVIDIA de que modelos menores bem coordenados poderiam desempenhar um papel crucial no futuro da IA. O resultado, segundo os desenvolvedores da Coral, reflete uma mudança conceptual na abordagem da escalabilidade da IA, em vez de um mero aumento no poder do sistema.
Como um protocolo aberto, o Coral facilita a expansão das capacidades de IA ao permitir a coordenação entre agentes especializados globalmente, em vez de depender de modelos gerais centralizados. Sua arquitetura permite a interação paralela e segura entre agentes, melhorando a funcionalidade dos modelos de linguagem de todos os tamanhos em tarefas que requerem raciocínio avançado, planejamento e resolução de problemas.
“Este avanço marca um ponto de viragem na infraestrutura de IA,” disse Caelum Forder, CTO da Coral, em um comunicado escrito. “É prova de que a escalabilidade horizontal não é apenas possível—é prática, e a Coral é a forma mais eficaz de o fazer. A Internet dos Agentes é agora uma realidade em funcionamento. Se você é um desenvolvedor de agentes, basta Coralise. Se você é um desenvolvedor de aplicações, construa melhor por menos usando a nossa infraestrutura,” acrescentou.
Coral Tops GAIA Benchmark, Valida o Poder de Modelos Pequenos em Sistemas Agenticos Avançados
Num cenário de crescente concorrência para desenvolver sistemas agentes avançados, grande parte do foco tem permanecido em escalar modelos para gerenciar a crescente complexidade das tarefas. O desempenho recente do Coral desafia essa abordagem predominante, alinhando-se com as descobertas de um estudo recente da NVIDIA que sugere que sistemas menores podem oferecer alto desempenho sem comprometer velocidade, segurança ou eficiência. O GAIA Benchmark, um conjunto de avaliações abrangente para IA avançada, foi projetado para avaliar quão bem os sistemas lidam com tarefas do mundo real que normalmente exigiriam tempo e habilidades substanciais de especialistas humanos. Composto por 450 prompts complexos que testam capacidades de pesquisa, análise e raciocínio, o benchmark serve como uma métrica chave da indústria para avaliar a eficácia de modelos de linguagem de propósito geral (LLM) agentes.
O Sistema de Agentes GAIA da Coral, utilizado no teste de referência, é baseado no Protocolo Coral e inspira-se nos princípios de design do OWL da CAMEL. Incorpora agentes especializados para realizar uma variedade de tarefas, incluindo pesquisa, análise, crítica, planejamento e navegação na web, todas as quais se comunicam através da infraestrutura de servidor MCP da Coral.
Liderar o ranking GAIA Benchmark para modelos menores indica o potencial do Coral para estender a funcionalidade dos sistemas de IA através de uma estrutura baseada em gráficos. Este resultado sugere que agentes leves e de alto desempenho podem ser criados usando modelos menores—facilitando um manuseio de dados mais amplo, uma integração mais suave no ecossistema e uma comunicação aprimorada entre agentes.
“O papel dos pequenos modelos em sistemas agentes tem sido subestimado até agora, mas as marés estão começando a mudar,” disse Caelum Forder. “Provamos que tais modelos podem escalar além de seus limites conhecidos anteriormente e superar os incumbentes. Estou confiante de que eles têm um papel central a desempenhar no futuro da IA agente,” concluiu.