-
-
Notifications
You must be signed in to change notification settings - Fork 404
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
[Novo spider base]: Nome não identificado #1243
Labels
spider-base
Adiciona robô raspador para um padrão
Milestone
Comments
This was referenced Aug 7, 2024
trevineju
added
enhancement
Melhoria, novo recurso ou ferramenta
spider
Adiciona robô raspador para município(s)
dificuldade:baixa
Pouco desafiador de desenvolver
labels
Aug 7, 2024
trevineju
added
spider-base
Adiciona robô raspador para um padrão
and removed
enhancement
Melhoria, novo recurso ou ferramenta
spider
Adiciona robô raspador para município(s)
dificuldade:baixa
Pouco desafiador de desenvolver
labels
Sep 15, 2024
@trevineju eu encontrei essa informação aqui a respeito do primeiro link |
aqui você se refere ao possível nome para nomear a classe base? |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
URL
não identificada
Municípios replicados
Formato da publicação
Os diários oficiais são publicados em PDF (texto)
Detalhes do site de publicação
Possui filtro por data
Observações
No geral, na página tem algum rastro de "desenvolvido por tal" ou alguns elementos no código-fonte que indicam que empresa ou órgão público desenvolveu a solução. Usamos essa informação para nomear a classe base. Em uma verificação inicial, não encontrei quem foi. Se quem for fazer a tarefa de desenvolvimento também não encontrar, poderá nomear a classe base como preferir, mas com bom senso.
Apesar do filtro por data, como a lista de diários é continua (ou seja, não tem paginação, todos os diários estão já na página inicial) não parece ser relevante construir o raspador usando a navegação do filtro.
Não existe uma issue aberta sobre isso
The text was updated successfully, but these errors were encountered: