Vila INTEIA: simulador multiagente brasileiro bate climatologia em previsão de Bitcoin
A Vila INTEIA, simulador multiagente brasileiro que combina 142 personas sintéticas, teoria dos jogos, dinâmica de opinião e cálculo do-calculus de Judea Pearl, atingiu a onda 283 de desenvolvimento nesta semana com um marco que o time vinha perseguindo há meses: um forecaster específico para Bitcoin que bate a climatologia em 10% em backtest sobre eventos novos. A entrega veio no PR #216, mergeado ao branch principal em 28 de abril, e foi seguida pela conexão ao vivo com a API do Manifold Markets — primeira integração do projeto a um mercado preditivo externo em produção.
O resultado consolida uma trajetória de 28 meses de engenharia aberta. O repositório no GitHub passou da marca de 159 ondas implementadas com 353 testes automatizados, todos passando, e a arquitetura completa — engine de simulação, motor de regras, calibrador online, GraphRAG nativo, servidor MCP, dashboard cockpit — está disponível sob licença pública.
O que a Vila INTEIA faz
Em uma frase: simula como uma comunidade de 142 personas com personalidades, vieses cognitivos e redes sociais reais reage a um evento, e usa o resultado dessa simulação como entrada para um forecaster probabilístico. A inspiração mistura psicohistória de Asimov, modelos de difusão social de Bikhchandani e Latané, e jogos repetidos de Axelrod e Ostrom — referências que aparecem implementadas como módulos Python testáveis dentro do repositório.
Cada persona carrega traços herdados da literatura de personalidade (Big Five, MBTI, valores de Schwartz), uma posição em rede (clusterização de Watts-Strogatz, dinâmica de Schelling), e regras de atualização bayesiana próprias. Quando um evento entra no sistema — uma eleição, uma decisão de mercado, um anúncio corporativo — o motor roda 1.000 a 10.000 cenários paralelos e produz uma distribuição de probabilidades, não um número único.
O time chama essa distribuição de "opinião emergente da Vila". A média é a previsão. A variância indica quanta divergência existiu entre os agentes. A cauda longa sinaliza eventos de alto impacto e baixa probabilidade.
O salto da onda 283
Bitcoin é difícil de prever. A maior parte dos modelos públicos performa pior que a climatologia — uma baseline simples que devolve a frequência histórica do evento. Bater climatologia em previsão de criptomoedas é, para a literatura acadêmica, sinal de capacidade preditiva real.
A onda 283 entregou exatamente isso: um forecaster especializado que combina o consenso das 142 personas com sinais técnicos calibrados (volatilidade implícita, estrutura de futuros, fluxo on-chain). Em backtest controlado sobre 40 eventos do holdout v2 — todos pós-cutoff de treinamento de agosto de 2024 —, a Vila ficou 10% abaixo do erro quadrático médio da climatologia. Brier score de 0,196 contra 0,218. Diferença pequena em valor absoluto, gigante em termos práticos: significa que a Vila está adicionando informação genuína, não apenas reembrulhando o que já é público.
O time fez questão de submeter o resultado ao AutoResearch, módulo automatizado que roda análise estatística sobre toda nova entrega. O sistema confirmou skill score positivo com intervalo de confiança de 95% excludente de zero. Em outras palavras: o ganho não é ruído.
Onda 280: previsão como serviço
Antes do BTC, na onda 280, a equipe entregou um forecaster genérico via Claude Code OAuth. A integração permite que qualquer modelo Anthropic acessível por OAuth — Sonnet, Opus, Haiku — gere previsões usando a infraestrutura completa da Vila como contexto. O endpoint expõe uma API REST padrão e devolve resposta no formato Helena 8-blocos: previsão, racional, fontes, dissidência, calibragem, diagnóstico, ações sugeridas, status do prior.
A camada de wrap ForecastResult, mergeada nos commits 2b453f9 e 97a0dfd, padroniza a saída para que o forecast-mega-bench (script forecast_mega_bench.py) possa rodar comparações cruzadas entre modelos. Roda em uma linha de comando: python -m engine.forecast.mega_bench --eventos data/holdout_v2.jsonl --modelos haiku,sonnet,opus.
Onda 279: mercados preditivos ao vivo
A integração com a Manifold Markets, na onda 279, abriu o caminho para a Vila operar contra benchmarks externos em tempo real. Manifold é um mercado preditivo americano com mais de 100 mil traders ativos e milhares de questões abertas a cada momento — desde resultados eleitorais até preços de ativos e marcos científicos.
O conector publica probabilidades da Vila como um agente do mercado e registra retorno, calibração e ranking. A primeira semana de operação, ainda em modo paper trading, mostrou a Vila acima da mediana dos traders humanos em 14 de 20 questões testadas. O número não tem peso estatístico ainda — amostra pequena —, mas estabelece o pipeline. A partir de maio, o time pretende ativar trading com limite de risco baixo para gerar dados em produção.
A arquitetura por baixo
Quem espia o repositório encontra uma estrutura em camadas:
- engine/game_theory — Nash, Stackelberg, VCG, replicator dynamics, Axelrod, Ostrom
- engine/opinion_dynamics — DeGroot, Deffuant, Bikhchandani (cascatas), Bayes, Latané
- engine/simulacao_avancada — A*, Shapley, Schelling, Hotelling, Watts-Strogatz
- engine/psicohistoria — grafo de Markov, Plano Seldon, detector de Mule (eventos disruptivos)
- engine/causalidade — implementação do do-calculus de Pearl: intervir, contrafactual, ATE
- engine/memoria/grafo — GraphRAG nativo com hook de recuperação
- engine/mcp_server — 7 ferramentas MCP expostas para agentes externos
- engine/distribuido — esqueleto Ray actors + vLLM para escalabilidade horizontal
A integração com plataformas — Twitter, Reddit, LinkedIn, TikTok — foi entregue na onda 7 e refatorada na onda 22. Cinco datasets históricos servem de calibração: eleição SP 2024, lançamento Apple Vision Pro, crise das Lojas Americanas, impeachment de Dilma e viralização TikTok. Total: 50 eventos curados com timeline e desfechos verificáveis.
Por que isso importa para o Brasil
Forecasting probabilístico de qualidade industrial é dominado por laboratórios americanos: Metaculus, Manifold, Good Judgement Project. O ecossistema brasileiro de IA produz muito modelo de linguagem, pouca infraestrutura de previsão calibrada. Vila INTEIA é uma das poucas iniciativas no país que entrega o pipeline completo — coleta, simulação, calibração, métrica, deploy — em código aberto.
Igor Morais Vasconcelos, advogado, doutorando do IDP e fundador do projeto, posicionou a Vila como infraestrutura para usos práticos: monitoramento eleitoral, análise de risco regulatório, due diligence em fusões, leitura de mercados financeiros e identificação de oportunidades em editais públicos. A licença permite uso comercial sem royalties.
A própria INTEIA, casa onde o projeto foi gestado, opera a Vila internamente para pesquisas eleitorais sintéticas em Brasília e Roraima — o sistema de pesquisa que dialoga com 5.000 personas sintéticas paulistas e o banco de 2.015 eleitores do Distrito Federal e Roraima já compartilha módulos com a Vila INTEIA.
O que vem na onda 284
O time já sinalizou a próxima entrega: forecast-mega-bench consolidado com seções de avaliação Helena 8-blocos como sumário executivo, score de qualidade em seis dimensões e exportação para .docx no padrão visual INTEIA — preto e dourado, fonte Cormorant Garamond, prontos para apresentação a clientes e investidores.
Em paralelo, oito novos teoremas e cinco novos datasets serão integrados via três agentes paralelos rodando em pipeline contínuo. O ritmo médio do projeto, segundo o MANIFEST.md, está em uma onda funcional a cada 36 horas — modelo de desenvolvimento incremental que mantém o build sempre verde e cada release passível de auditoria.
A Vila INTEIA é o tipo de projeto que se constrói devagar e em público, com cada artefato versionado, cada teste rodando em CI, cada métrica disponível para inspeção. Em um momento em que a discussão sobre IA brasileira oscila entre euforia de fundo e ceticismo militante, ver código real entregando resultado real é o que distingue uma plataforma viável de mais uma promessa.
Receba o Mirante no seu email
As principais notícias do dia, curadas por inteligência artificial, direto na sua caixa de entrada.