假如你是数据竞赛的初学者、爱好者,比赛的baseline不仅是比赛思路分享,同时也是一类数据问题的方法总结。本Repo想做的就是将收集并整理并分享各种比赛的baseline方案。
你可能会问为什么是baseline,而不是获胜者的代码分享?相比于获胜者的代码baseline代码都比较简单,容易整理和学习;其次baseline代码更加实用和简洁,适合入门学习。
最新的竞赛信息和baseline推送,请关注我们的微信公众号:Coggle数据科学,知乎专栏:机器学习理论与数据竞赛实战
-
国外竞赛平台:
-
国内竞赛平台
-
DataSciCamp竞赛列表:https://www.datascicamp.com/?sub=DM,CV,NLP,RL,SP
每个比赛的详细分享请见competition文件夹;
- AI研习社-白葡萄酒品质预测,结构化数据比赛
- AI研习社-肌肉活动电信号推测手势,结构化数据比赛
- 点石-Retention Rate of Baidu Hao Kan APP Users,结构化数据比赛
- kaggle-two-sigma-connect-rental-listing-inquiries,结构化数据比赛
- kaggle-allstate-claims-severity,结构化数据比赛
- AI研习社-胸腔X光肺炎检测,CV类型比赛
- AI研习社-肺炎X光病灶识别,CV类型比赛
- AI研习社-美食识别挑战(1):豆腐VS土豆,CV类型比赛
- CCF2019-视频版权检测算法,CV类型比赛
- kaggle-quickdraw-doodle-recognition,CV类型比赛
- TinyMind人民币面值&冠字号编码识别挑战赛,CV类型比赛
- biendata-智源&计算所-互联网虚假新闻检测挑战赛,NLP类型比赛
- CCF2019-互联网金融新实体发现,NLP类型比赛
- CCF2019-技术需求与技术成果项目之间关联度计算模型,NLP类型比赛
- CCF2019-互联网新闻情感分析,NLP类型比赛
- Tianchi-第三届阿里云安全算法挑战赛,NLP类型比赛
其他链接:Smile整理的竞赛优胜者代码分享
欢迎大家fork并贡献代码,但请大家遵守以下规范和建议:
-
代码请按照比赛的形式进行整理,写明比赛的网址、数据类型和解题赛题;
-
代码请注明运行的环境,以及机器最低配置,如:
- 操作系统:Linux,内存16G,硬盘无要求;
- Python环境:Python2/3
- Pytorch版本:0.4.0
-
baseline代码只能提供可运行的代码和思路,请不要提供直接可以提交的结果文件;
-
代码提供者应对代码版权和共享权负责;
-
如果发现Repo存在版权等相关问题,请邮件联系[email protected]