Skip to content
This repository has been archived by the owner on Mar 23, 2023. It is now read-only.

Metodologia e ferramentas #51

Open
ppKrauss opened this issue Jul 18, 2017 · 3 comments
Open

Metodologia e ferramentas #51

ppKrauss opened this issue Jul 18, 2017 · 3 comments

Comments

@ppKrauss
Copy link

A marcação semântica, principalmente de entidades nomeadas, já tem ferramentas consolidadas. A principal delas vem da equipe DBpedia que está firmando convênio com a OKBr (!), o projeto Spotlight,
http://www.dbpedia-spotlight.org/

A metodologia Spotlight pode ser resumida em 4 passos:

@bsantosri
Copy link
Collaborator

bsantosri commented Aug 16, 2017 via email

@ppKrauss
Copy link
Author

Olá @bsantosri,

o uso de recursos semânticos mais sofisticados é opcional. O que fiz por exemplo no report01 é também semântico (garantia de que o termo marcado é name de Person) mas é automatizado. Apelamos para o Spotlight quando precisamos ainda mais marcações, e não temos como automatizar... Aí o Spotlight é como um assistente, vai ajudar a selecionar trechos do texto e marcações que fazem sentido.

Na figura o "spotting" é isso, determinar quais os fragmentos de conteúdo que serão alvo desse processamento assistido pelo Spotlight. Daí em diante a coisa seguiria como o site deles descreve.

Como ainda não temos interfaces bonitas e simpáticas, seriam os experts da equipe que preparariam todo o material para ser submetido ao Spotlight e, no final, alimentariam de volta a base de dados com o material marcado.

@ppKrauss
Copy link
Author

Importante (!), essa issue não é "a metodologia", é um ticket, uma issue de sugestão de new feature, ou seja, a sugestão de incrementar o QueriDO através do uso do Spotlight.

Talvez precise mudar o título... A "metodologia geral do QueriDO" se baseia em duas vertentes:


Metodologia Serenata

Ver artigo Como cidadãos empoderados podem conversar com deputados? do Cuducos.

  1. Com base na Lei, nos autos da Justiça, nas verdades da Ciência e no bom-senso, a curadoria cria uma hipótese de como os atos registrados no Diário Oficial

    • podem ter uma origem regular ou ilícita;
    • podem ser consistentes ou inconsistentes;
    • podem ser evidência ou não (para ser somada a outras evidências já comprovadas).
  2. A curadoria, com ajuda dos experts, transcreve essa hipótese, em forma de asserções lógicas e queries (ex. SQL), para que ...

    2.1. os experts busquem nos milhões de textos quais casos batem com a hipótese, ou seja, quais dariam origem a suspeitas;

  3. A curadoria, ainda com algum suporte dos experts, audita manualmente os resultados e caso essa equipe de curadores corrobore a suspeita, denuncia-se o caso a jornalistas, juristas e outros especialistas;

  4. Quando essa outra comunidade responde (ou o próprio governo pela Lei de Acesso à Informação), aí sim a curadoria pode emitir um parecer, redige seu relatório com teor mais sério e definitivo, divulgando resultados específicos.

Sign up for free to subscribe to this conversation on GitHub. Already have an account? Sign in.
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants