Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

部分页面识别结果不准确 #152

Open
WyHy opened this issue Jul 15, 2024 · 3 comments
Open

部分页面识别结果不准确 #152

WyHy opened this issue Jul 15, 2024 · 3 comments
Labels
bug Something isn't working

Comments

@WyHy
Copy link

WyHy commented Jul 15, 2024

Description of the bug | 错误描述

在我的case中,结果不准确包含以下几方面:

  1. 文本内容未识别,如第1页的“甲状腺专科专家委员会...”;第10页最上面的标题“糖化血红蛋白”;第14页的“未检项目”
  2. 检测框位置不准确,如第3页的上半页,检测框有点偏上,导致最后一行只截取了一半
  3. 识别文本内容不完成,如第4页最上面的“体检所见:右眼...”,只识别出了“左眼...”文本

大部分情况下,结果是准确的。我想了解下,以上问题出现的原因及解决方案,非常感谢

How to reproduce the bug | 如何复现

test.pdf
magic-pdf pdf-command --pdf "test.pdf" --inside_model true

Operating system | 操作系统

Linux

Python version | Python 版本

3.10

Device mode | 设备模式

cuda

@WyHy WyHy added the bug Something isn't working label Jul 15, 2024
@drunkpig
Copy link
Collaborator

@WyHy 目前版面模型支持较好的文档格式大致有中英文论文,科技杂志、中文财报、中英文正规出版物书籍。你给出的体检单看上去和我们模型训练中使用较多的数据风格上有较大差距,因此效果表现不佳。
是否有意提供一批这样的数据,用于模型在这方面的增强?

@WyHy
Copy link
Author

WyHy commented Jul 16, 2024

@WyHy 目前版面模型支持较好的文档格式大致有中英文论文,科技杂志、中文财报、中英文正规出版物书籍。你给出的体检单看上去和我们模型训练中使用较多的数据风格上有较大差距,因此效果表现不佳。 是否有意提供一批这样的数据,用于模型在这方面的增强?

@drunkpig 留个联系方式,我有一些网上找的资源,私发你哈

@drunkpig
Copy link
Collaborator

a5b9aafe868c4165f180fb4d64ad6b4
我的WX @WyHy

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
bug Something isn't working
Projects
None yet
Development

No branches or pull requests

2 participants