Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

“攻击”、“狙击”等含“击”词语 的“击”字有“ji1”音。 #29

Closed
poorich opened this issue Feb 24, 2021 · 5 comments

Comments

@poorich
Copy link

poorich commented Feb 24, 2021

“攻击”、“狙击”等含“击”词语 的“击”字有“ji1”音。

Originally posted by @BinglunGe in #24 (comment)

「擊」字相關的詞語 表中不少(約150+條)是第二聲 

@LEOYoon-Tsaw
Copy link
Member

LEOYoon-Tsaw commented Feb 24, 2021

不止此字,地球拼音主要取自臺灣國語注音,讀法都是國語讀音。
大陸哪有帶調拼音詞庫?在大陸根本無有輸入法關心聲調,當然無有相關材料可用。
最好找到有一定規模的大陸普通話帶調詞庫,一併加入。逐字改不是個辦法。

@lotem
Copy link
Member

lotem commented Feb 25, 2021

​只有這個辦法。
導入其他詞庫不能解決問題。
需要把對該字註音的詞條刪除,但須保留其中需要標註其他多音字的詞條、對這些詞條標註「擊」的兩種讀音。

@LEOYoon-Tsaw
Copy link
Member

這樣的字還多著呢

@lotem
Copy link
Member

lotem commented Feb 25, 2021

這樣的字還多著呢

​這就是現實。
亦即維護這個詞典的困難之處。
每加入一批數據都應當對包含多音字特別是異讀音進行干預。現存的問題源於之前導入數據時沒有做這項處理。

導入其他詞庫如果不經人工干預:無法保證每個數據數據源包含的詞條完全「對齊」,即不多不少包含相同的詞條,否則比其他來源多出的詞仍會缺失該數據源未收錄的異讀音,也就會出現本帖發現的問題。

不僅要審查導入的詞條,還得審查原有詞條是否需要標記新產生的異讀音。比如添加了「擊」的異讀音 jí,則須補充標註原有的、含其他多音字的詞條「長擊」。

@lotem
Copy link
Member

lotem commented Feb 27, 2021

宜併入 #32

@poorich poorich closed this as completed Mar 2, 2021
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants