Project_Winter

ybigta 1st project

1주차 팀프로젝트

19/2/13 : feature 탐색
19/2/14 : EDA ( application_train )
19/2/15 : EDA 통합 & 팀 미팅 (예정) / NA 처리 방법 , 머지 방법 확정
19/2/16 : FE 마무리 및 팀 발표

2주차 팀프로젝트

19/2/18 : 모델링 방법 탐색, boosting 모델 활용 CAT boost로 1차 제출하여 확인
19/2/20 : boosting 모델 Light GBM, XGBoost 모델 추가 사용
19/2/21 : 다시 FE 과정 / 파생변수 추가 최종데이터셋 확정
19/2/22 : XGB, Light GBM, CatBoost 합쳐 Stacking 최종 제출데이셋 확정
19/2/23 : 최종 팀 발표 및 대출데이터 팀 중 1등

역할

종혁 / (팀장) 모델링 및 전처리 등 총괄
승민 / 모델링 및 EDA
나현 / 파생변수 확인 및 시각화, PPT 제작
성희 / 파생변수 총괄 FE 책임

파일 정리

1주차 EDA 파일(application 관련 데이터만)
FE 자료는 AWS에서 하다가 실수로 지움... / 파생변수나 다른 파일 Merge는 다른 팀원이 R로.
2주차 최종 모델링 파일 ( BO, modeling, stacking ... )

개인적인 소감

불균형 데이터와 FE이 정말 난감한거 같음. 더 고민해봅시다..
실제 kaggle 자료를 이용해서 (더러운) 데이터를 처음 만져봐서 당황스럽기도 했음.
Boosting 모델도 처음 접해보고 개괄적인 파악만 해서 사용하는데만 집중했기 때문에 이론적인 공부를 더 해야한다고 생각.
따라서, 시간될 때 Bayesian Optimization, XGBoost, Light GBM, CatBoost 논문 리뷰를 해보자.
나머지 공부는 Data Mining 전공 시간에...

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
Boosting.ipynb		Boosting.ipynb
README.md		README.md
ybigta&P-SAT.ipynb		ybigta&P-SAT.ipynb
최종 발표 자료.pdf		최종 발표 자료.pdf

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Project_Winter

1주차 팀프로젝트

2주차 팀프로젝트

역할

파일 정리

개인적인 소감

About

Releases

Packages

Languages

SeungminHeo/Project_Winter

Folders and files

Latest commit

History

Repository files navigation

Project_Winter

1주차 팀프로젝트

2주차 팀프로젝트

역할

파일 정리

개인적인 소감

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages