O objetivo do projeto é superar as desigualdades no campo a partir de pesquisa, desenvolvimento, inovação (PD&I) em Tecnologia da Informação e Comunicação (TIC) visando ampliar a produção e produtividade dos pequenos e médios produtores.

Please enter subscribe form shortcode

31 de March de 2026

“O problema não são os modelos, são os dados”, avalia pesquisador do Semear Digital

Pesquisador do Semear e da Embrapa Agricultura Digital, Jayme Barbedo, analisou mais de 40 estudos que utilizam visão computacional na agricultura em diferentes culturas, sensores e aplicações para mapear padrões recorrentes de sucesso e falha. O autor concluiu que ampliar o volume e a diversidade de dados é essencial para que os modelos funcionem melhor em condições reais. O artigo foi publicado recentemente na revista Computers and Electronics in Agriculture.

A análise abarcou estudos que utilizaram imagens capturadas por câmeras terrestres e drones para diferentes aplicações agrícolas, como detecção de doenças, estimativa de produtividade e monitoramento de lavouras. O objetivo foi entender até que ponto esses sistemas são capazes de funcionar em condições reais, marcadas por alta variabilidade ambiental.

Segundo o pesquisador, os modelos atuais já atingiram um nível elevado de desempenho quando operam em condições controladas. O problema surge quando são expostos à diversidade do campo. “Se você alimenta os modelos com dados que representam muito bem o problema, eles quase sempre vão funcionar. O problema é que na agricultura a gente tem uma variedade de condições muito grande”, explica o autor.

Essa variabilidade inclui diferenças de iluminação, clima, arquitetura das plantas, solo e até mesmo a forma como as doenças se manifestam. Como resultado, modelos treinados com bases limitadas tendem a falhar ao serem aplicados em novos contextos. Segundo Barbedo, esses elementos ajudam a explicar por que um modelo aparentemente acurado pode perder eficiência quando aplicado fora do contexto em que foi treinado.

O artigo aponta que a principal limitação não está nos algoritmos, mas na insuficiência e falta de diversidade dos dados. Construir bases robustas que representem a realidade agrícola exige um volume massivo de imagens coletadas em diferentes condições, algo ainda difícil de alcançar. “Você precisa às vezes centenas, milhares, talvez milhões de imagens para representar essa variabilidade. E isso é praticamente inviável sem um esforço coletivo”, pontua o pesquisador.

Outro problema recorrente é a forma como os modelos são avaliados. Muitos estudos utilizam conjuntos de dados semelhantes para treino e teste, o que gera uma falsa impressão de desempenho elevado. Na prática, esses sistemas não foram testados em cenários realmente diferentes, o que compromete sua aplicabilidade.

Cautela para novas tecnologias

Essa desconexão entre resultados científicos e uso real ajuda a explicar por que muitas soluções não chegam ao campo ou fracassam ao serem implementadas. “Tem que ter um cuidado muito grande de não introduzir uma tecnologia que não está pronta. Isso pode gerar frustração e prejudicar a confiança dos produtores”, alerta Barbedo.

Entre os caminhos para superar essas limitações, o pesquisador aponta o compartilhamento de dados entre instituições e países, ampliando a diversidade das bases disponíveis. “Embora já exista incentivo de agências de fomento, como a FAPESP, ainda há poucas bases abertas capazes de atender essa demanda”, destaca o pesquisador.

Outra estratégia é envolver os próprios produtores na coleta de dados, em modelos de ciência cidadã. Nesse caso, aplicativos e incentivos podem transformar celulares em ferramentas de geração de dados em larga escala.

Além disso, o autor destaca o potencial de integrar diferentes tipos de informação. Mesmo com grandes volumes de imagens, muitas vezes elas não são suficientes para uma resposta precisa, já que diferentes doenças e estresses podem gerar sintomas muito semelhantes. Entretanto, a combinação com dados meteorológicos, de solo e de manejo amplia o contexto da análise e aumenta significativamente a confiabilidade dos resultados. “Você passa a ter várias pistas, como um detetive, e consegue chegar a uma resposta mais confiável”, explica Barbedo.

Neste sentido, o Projeto Semear Digital, ao atuar em diferentes regiões do Brasil por meio dos distritos agrotecnológicos, cria condições ideais para enfrentar um dos principais gargalos identificados pelo estudo, a variabilidade dos dados. Testar tecnologias em contextos diversos permite gerar bases mais representativas e avaliar soluções em condições reais.

O artigo “Transferability and Robustness in Proximal and UAV Crop” pode ser acessado em https://doi.org/10.3390/agronomy16030364.

Paula Drummond

Graziella Galinari (MTb 3863/PR)
Embrapa Agricultura Digital

Contatos para a imprensa

Keep up to date with Semear Digital!

Sign up to our newsletter to receive updates and information about our latest publications.