Pular para conteúdo

Notícias Agrícolas — Fallback CEPEA

Licença: Todos os direitos reservados (Lei 9.610/98). Empresa privada sem termos de uso públicos sobre republicação de cotações. Dados originários do CEPEA estão sujeitos a CC BY-NC 4.0. Classificação: restrito

Fallback ativo

Este módulo é o fallback principal para contornar proteção Cloudflare no site do CEPEA. Enquanto o CEPEA estiver protegido por Cloudflare, o NA é a fonte efetiva de dados. Um warnings.warn() é emitido no primeiro uso.

Visão Geral

Campo Valor
Operador Olivi Produções de Vídeo e Comunicação LTDA
Website noticiasagricolas.com.br
Licença restrito — todos os direitos reservados
Papel no agrobr Fallback do CEPEA (3ª opção após httpx direto e Playwright)
Dados 100% republicação CEPEA/ESALQ — sem dado exclusivo

Como funciona no agrobr

O módulo Notícias Agrícolas não é chamado diretamente pelo usuário. Ele é acionado automaticamente pelo módulo CEPEA quando:

  1. Requisição httpx direta ao CEPEA falha (Cloudflare 403)
  2. Playwright não está instalado ou também falha
  3. Circuit breaker abre para CEPEA httpx

Dados Semanais

Algumas tabelas do NA contêm médias semanais no formato 09 - 13/02/2026. O parser extrai a data final do intervalo e marca esses registros com anomalies=["media_semanal"] e meta["tipo"]="media_semanal", meta["periodo"]="09 - 13/02/2026". Isso permite distinguir cotações diárias de médias semanais no DataFrame retornado.

Validação de Conteúdo (Soft Block)

Alguns usuários recebem do NA uma página de consent/challenge (HTTP 200, ~10KB sem tabela) em vez da página de dados (~75KB com tabela). O client valida o conteúdo antes de retornar: se o HTML é < 20KB e não contém <table, levanta SourceUnavailableError com mensagem "soft block", ativando o cache fallback no módulo CEPEA.

Fonte

  • URL: https://www.noticiasagricolas.com.br/cotacoes/
  • Formato: HTML (server-side rendered, sem JavaScript)
  • Atualização: diária (segue CEPEA)
  • Licença: restrito