
Câmara fria da Embrapa Cenargen onde sementes do cerrado são preservadas a -18 graus, parte do banco de germoplasma com mais de 130 mil acessos
O cerrado brasileiro tem 12.600 espécies — e o laboratório que as cataloga fica no DF
A planta entrou no laboratório dentro de um saco plástico transparente, ainda com terra grudada nas raízes. Tinha sido coletada cinco dias antes em uma vereda do Parque Nacional de Brasília, fotografada de quatro ângulos, georreferenciada com precisão de 30 centímetros e colocada em uma geladeira portátil. Naquela manhã de março, ela viraria a 9.847ª espécie sequenciada pelo banco de germoplasma do cerrado brasileiro.
O cerrado é o segundo maior bioma brasileiro em área e o primeiro em densidade de espécies endêmicas. Os números, repetidos em apresentações há décadas, ganharam contornos novos nos últimos cinco anos: estima-se que existam ao menos 12.600 espécies vegetais distintas dentro de seus limites originais, das quais cerca de 4.400 só ocorrem nessa porção do território nacional.
Catalogar todas elas, com nome científico, descrição morfológica e ficha genética completa, é o trabalho que se desenrola, em silêncio, em alguns prédios da Asa Norte e da rodovia DF-001.
Onde a coisa acontece
O epicentro do esforço fica no Parque Estação Biológica, conhecido pela sigla PqEB, o complexo onde a Embrapa concentra suas unidades especializadas. Dentro dele, o Centro Nacional de Pesquisa de Recursos Genéticos e Biotecnologia, abreviado como Cenargen, opera o maior banco de germoplasma vegetal da América Latina.
São mais de 130 mil acessos guardados em câmaras frias a -18 graus, cada um identificado por um código que remete a fichas com origem, coletor, data, dados climáticos e, cada vez mais, sequências genômicas completas.
A duas dezenas de quilômetros dali, do outro lado da cidade, o Jardim Botânico de Brasília mantém uma coleção viva de mais de 1.200 espécies do cerrado em ambiente natural protegido. Não é redundância.
O Cenargen guarda material para extração e replicação. O Jardim Botânico preserva indivíduos vivos para observação fenológica, estudos de polinização e atividade educacional.
Os dois bancos se conversam por meio de protocolos de troca formalizados em 2018.
A Universidade de Brasília entra na equação como parceira analítica. O Departamento de Botânica e o Instituto de Ciências Biológicas operam os equipamentos de sequenciamento de nova geração que processam o material recebido.
Um sequenciador Illumina NovaSeq 6000, instalado em 2023, é o cavalo de batalha da operação. Outro, mais recente, da PacBio, faz o trabalho de leitura longa que permite reconstruir genomas completos sem fragmentação excessiva.
A linha de produção
O processo, descrito pelos pesquisadores em termos quase industriais, segue uma sequência rígida. Primeiro vem a coleta em campo, autorizada pelo SISBio, sistema do Ministério do Meio Ambiente.
Em seguida, a herborização e a duplicata depositada no herbário UB da Universidade de Brasília. Depois, a extração de DNA em sala limpa do Cenargen, seguida pela quantificação fluorimétrica e pelo controle de integridade.
| Etapa | Tempo médio | Local | Equipamento | |---|---|---|---| | Coleta em campo | 1 dia | Unidades de conservação do DF | GPS submétrico | | Herborização e fotografia | 3 dias | Herbário UB | Câmara macro + prensa | | Extração de DNA | 1 dia | Cenargen, sala limpa | Kit comercial CTAB | | Sequenciamento NGS | 5 dias | UnB-IB | Illumina NovaSeq 6000 | | Montagem do genoma | 7 dias | Cluster computacional | SPAdes + Unicycler | | Anotação funcional | 4 dias | Cenargen + colaborações | InterProScan, BLAST | | Depósito final | 1 dia | Banco GenBank público | Fluxo automatizado |
O ritmo médio, considerando turnos de oito horas e cinco dias por semana, fica em torno de 40 espécies sequenciadas por mês. Em ano cheio, são quase 500.
No ritmo atual, o catálogo completo das 12.600 espécies do cerrado seria concluído em pouco mais de duas décadas — desde que nenhuma nova espécie seja descoberta enquanto o trabalho avança, o que está longe de ser garantido. Em 2025, equipes ligadas à Universidade Federal de Goiás descreveram 17 novas espécies vegetais do cerrado.
Em 2026, até abril, já são oito.
A bioeconomia que pode nascer disso
Nem toda planta sequenciada vira produto. A maioria não vira.
Mas o banco genético amplo é a precondição para que algumas se tornem. Pesquisadores do Cenargen trabalham com famílias específicas em busca de compostos com potencial farmacêutico, inseticida natural ou cosmético.
O barbatimão, o cagaiteiro, o pequi, o buriti e a copaíba já têm partes de seus metabolismos secundários mapeadas e protegidas por pedidos de patente que correm no INPI.
A copaíba é o caso mais avançado. O óleo extraído da árvore, conhecido empiricamente há séculos por populações tradicionais, contém uma classe de moléculas chamadas diterpenos com propriedade anti-inflamatória comprovada em ensaios pré-clínicos.
Um pedido de patente conjunta entre Embrapa e UnB, depositado em 2022 e ainda em análise, descreve um processo de extração otimizado que aumenta o rendimento dos compostos ativos em 38%.
Há disputas. A jurisprudência brasileira sobre repartição de benefícios advindos de conhecimento tradicional associado evoluiu nos últimos dez anos, mas continua intrincada.
Toda patente derivada de planta nativa precisa, hoje, comprovar acordo formal com comunidades locais quando há conhecimento tradicional envolvido. O Cenargen mantém um setor jurídico específico para isso, e o número de acordos assinados entre 2020 e 2025 cresceu em ritmo de dois dígitos ao ano.
A pressão do tempo
O cerrado perde área. Levantamentos do MapBiomas indicam que entre 1985 e 2024 o bioma perdeu cerca de 25% de sua cobertura vegetal nativa, com taxas anuais de desmatamento que oscilam entre 0,5% e 1,3%.
Cada hectare suprimido, sobretudo nas regiões de transição com a Amazônia e a Caatinga, leva consigo populações de plantas raras antes mesmo que a ciência tenha tido tempo de descrevê-las. O esforço de catalogação, no caso, é uma corrida contra o calendário.
Os pesquisadores sabem disso e priorizam. As listas de coleta planejada para 2026 incluem regiões consideradas hotspots de risco: cabeceiras do Tocantins, áreas de transição no oeste baiano, manchas residuais no leste de Mato Grosso.
Cada expedição custa entre R$ 30 mil e R$ 80 mil, dependendo da logística. Os recursos vêm de chamadas públicas do CNPq, de convênios com a iniciativa privada e, no caso recente, de um aporte da Caixa Econômica Federal por meio de fundo de biodiversidade.
O que fica
Quando o sequenciador termina uma rodada, a leitura bruta passa por um cluster computacional instalado no subsolo do Instituto de Ciências Biológicas. Os arquivos finais, depois de anotados, são depositados no GenBank, banco de dados público mantido pelos National Institutes of Health, nos Estados Unidos.
A partir desse depósito, qualquer pesquisador no mundo pode acessar a sequência. O Brasil dá o material e, simultaneamente, partilha com a comunidade científica internacional o conhecimento gerado.
Há quem critique essa abertura, alegando que ela facilita o uso comercial das informações por empresas estrangeiras sem retorno proporcional ao país de origem. Há quem defenda, argumentando que a ciência aberta acelera descobertas que beneficiam a todos.
O debate continua, mas, enquanto ele transcorre, a planta que entrou em um saco plástico naquela manhã de março já tem agora um número de acesso, uma sequência depositada, uma posição definitiva no mapa genômico do cerrado. Uma a menos.
Doze mil e quinhentas e noventa e nove a vir.
Score Hipnótico-Editorial
Transparência radical do framework editorial
Avaliação determinística baseada em 12 dimensões científicas
Saiba mais →Receba o Mirante no seu email
As principais notícias do dia, curadas por inteligência artificial, direto na sua caixa de entrada.