Olá,
Eu possuo bastante experiência com desenvolvimento em Python, e a tarefa proposta parece bastante interessante.
Para basta passar os URLs dos Diários dos estados, que podem ser convertidos para texto com bibliotecas como PyPDF2, e a saída pode ser gerada em HTML.
Algumas questões que gostaria de esclarecer.
1) A busca seria por número de processo ou por algum outro identificador único?
2) Uma vez identificado um evento de interesse em um Diário Oficial, o script deve extrair e interpretar dados (converter datas, identificar palavras-chaves, atribuir urgência etc) ou apenas recortar o texto para posterior visualização?
3) Além da extração das informações, vocês precisam de desenvolvimento/adaptação da interface com usuário.
atenciosamente
Fabio