Skip to content
This repository has been archived by the owner on Mar 23, 2023. It is now read-only.

marcar nomes próprios #40

Open
ppKrauss opened this issue Mar 8, 2017 · 2 comments
Open

marcar nomes próprios #40

ppKrauss opened this issue Mar 8, 2017 · 2 comments

Comments

@ppKrauss
Copy link

ppKrauss commented Mar 8, 2017

Usar givenName como palavra de referência para inicio de nome completo. Requer case sensitive e fica apenas de amostra, podendo ser removido em seguida: o seguindo passo é verificar se além do primeiro nome aparecem outras palavras iniciadas por maiúsculas em seguida. Outros contextos como nome de empresa devem bloquear essa marcação.

Ideal é aplicar apenas nas posições de texto onde são esperadas citações de nomes completos, tais como blocos de assinaturas (leis, atas, contratos, etc. apresentam assinaturas no back) ou de apresentação das partes (inicio de contrato, etc.).

PROBLEMA: requer um "dicionário de nomes mais frequêntes" confiável para gerar produto razoável. A base de dados de nomes próprios do IBGE é a mais importante neste sentido, mas não está disponível, falta requisitar.

ppKrauss added a commit that referenced this issue Mar 8, 2017
ppKrauss added a commit that referenced this issue Mar 8, 2017
ppKrauss added a commit that referenced this issue Mar 8, 2017
ppKrauss added a commit that referenced this issue Mar 8, 2017
@ppKrauss
Copy link
Author

Criando mais um projeto derivado para uso indireto aqui (o queriDO alimenta e vice-versa),
https://github.com/datasets-br/public-person
usa nome completo e CPF.

@ppKrauss
Copy link
Author

ppKrauss commented Apr 3, 2017

A tabela nacional do IBGE (fonte das estatísticas de http://censo2010.ibge.gov.br/nomes) foi solicitada ao eSIC nacional, via protocolo 03950.001069/2017-66.

Ver tb [email protected] ou e http://www.acessoainformacao.gov.br/

Sign up for free to subscribe to this conversation on GitHub. Already have an account? Sign in.
Projects
None yet
Development

No branches or pull requests

1 participant