<aside>
💡 KNOW 기반 직업 추천 알고리즘 DACON 공모전 상위 4% 1개월
</aside>

- 구분
- 구현 목적
- 한국고용노동부의 KNOW(한국직업정보) 설문 데이터 셋(2017~2020년도)을 활용한 직업 분류 문제 해결
- 직업과 연관이 높은 설문지 문항 분석 및 영향변수 발굴
- 기술 설명
- 약 537개의 직업군과 200개의 컬럼 데이터의 특성 파악 및 전처리
- 사용자 정의 함수를 이용한 규칙 적용 및 TF-IDF를 사용하여 텍스트 데이터에서 feature 선정
- score를 올리기 위한 전체적인 pipeline 설계
- 구현 기술
- RandomForest, ExtraTreesClassifier, XGBoost, CatBoost, SVM, KNN을 활용한 모델링 개선
- 텍스트 처리를 위한 TF-IDF를 활용하여 자격증과 직업 매칭률 상승
- 맡은 역할
- 자료 수집 및 정리, 데이터 전처리, 데이터모델링
- 프로젝트 하면서 어려웠던 점
- 도메인 지식을 활용한 feature engineering 필요
- 설문지 특성상 주관이 많이 들어간 row들 판단하기 어려움
- 협업을 위해 충분한 의사소통의 필요성
- 프로젝트 하면서 깨달은 점
- Text column들을 활용한 딥러닝 모델 추가 활용 필요
- 다양한 data augmentation 진행 후 모델 학습
know기반알고리즘추천.pdf