Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

PVM de alguma estratégia para gerar documentação em outras línguas baseado no original em Português #2

Open
fititnt opened this issue Dec 1, 2020 · 3 comments

Comments

@fititnt
Copy link
Member

fititnt commented Dec 1, 2020

Tópico sobre Produto viável mínimo de alguma estratégia para gerar documentação em outras línguas baseado no original em Português.

@fititnt
Copy link
Member Author

fititnt commented Dec 1, 2020

Estou testando o https://github.com/soimort/translate-shell (https://www.soimort.org/translate-shell/)

Por enquanto este é o resultado.

Captura de tela de 2020-12-01 17-02-22

fititnt@bravo:/workspace/git/EticaAI/EticaAI-linguistic-datasets-pt/bin$ trans :pt file://../README.md
Did you mean: # Etica E Linguistic Datasets PT
# EticaAI Conjuntos de dados linguísticos PT

Texto de exemplo em português para testar a ferramenta `bin/translate-readme`.

trans: pt file: ///../README.md
fititnt@bravo:/workspace/git/EticaAI/EticaAI-linguistic-datasets-pt/bin$ 

Creio que pode valer a pena ter mais conteúdo de exemplo.

@fititnt
Copy link
Member Author

fititnt commented Dec 1, 2020

Comando trans -brief file://README.md -o README.en.md

Ok. Alguns erros que ele comete com formatação (como separar o ** e _ das palavras e o markdown de resultado sair ruim) possivelmente daria para ate dar um string replace.

Outra opção pode ser simplesmente abrir o navegador e o humano copia e cola o resultado.

README.md

# EticaAI Linguistic Datasets PT
**[rascunho público Conjuntos de dados linguísticos para língua portuguesa
com licença flexíveis.**

(Nota: este documento está com texto de exempl em português para testar a
ferramenta `bin/translate-readme`.)

O objetivo desse projeto, inspirado pelo espírito de [FOSS](https://pt.wikipedia.org/wiki/Software_livre_e_de_c%C3%B3digo_aberto),
é listar fontes de representações de conhecimento que, ao depender da língua
e das culturas locais, não podem ser importadas. Requerem atenção especial, de
caráter multidisciplinar, e que idealmente _já deveria estar prontas e
aceitavelmente validadas_: quando não existem, na melhor das hipóteses, podem
forçar serem feitas por não especialista e prejudicar qualidade, e na pior, até
impedir a produção de tecnologias inovadoras.

README.en.md

# EticaAI Linguistic Datasets PT
** [public draft Linguistic data sets for Portuguese
with flexible licenses. **

(Note: this document has sample text in Portuguese to test the
`bin / translate-readme` tool.)

The aim of this project, inspired by the spirit of [FOSS] (https://pt.wikipedia.org/wiki/Software_livre_e_de_c%C3%B3digo_aberto),
is to list sources of knowledge representations that, depending on the language
and local cultures, cannot be imported. They require special attention,
multidisciplinary character, and that ideally _ should already be ready and
acceptably validated_: when they do not exist, at best, they can
force them to be made by a non-specialist and impair quality, and at worst, until
prevent the production of innovative technologies.

@fititnt
Copy link
Member Author

fititnt commented Dec 1, 2020

Uma alternativa também seria abrir o em um navegador e a pessoa copiar o que tem de novo e talvez só se preocupar em arrumar formatação do markdown. Se a ferramente de tradução traduzir errado os termos, pode-se deixar assim mesmo.

trans pt:en -browser firefox -brief https://raw.githubusercontent.com/EticaAI/EticaAI-linguistic-datasets-pt/main/README.md

Captura de tela de 2020-12-01 17-37-48

fititnt added a commit that referenced this issue Dec 2, 2020
…omática, sem revisão humana; explicitado que planilhas usadas no momento não estão prontas para uso em produção
fititnt added a commit that referenced this issue Dec 3, 2020
…tasets-pt-data (#5):

bin/translate-readme: [PT] v2.0 v2.0; abre navegador em vez de usar translate-shell
bin/save-files: [PT] Arquivos de data/ agora são salvos em EticaAI-linguistic-datasets-pt-data
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant