python3 회귀분석 모델링 오답노트 . txt 역시 돈내고 받는 데이터는 다른가.... 무료 api 로 데이터 받아서 옛날처럼 분석하려니 전처리 너무 빡세다,,, 근데 와이스카웃은 일반인한테 데이터 공개 안해주잖슴ㅜㅜ 지난 포스팅동안, 열심히 회귀분석 모델링을 공부해 온 저와 여러분! 한 단계 더 발전하기 위해 지금까지 진행해온 모델링을 복습하고 새롭게 수정할 부분을 짚고 넘어가도록 해요! 1. 학습/테스트 데이터 경기 기준 전처리 저는 항상 모델링을 진행하며 데이터 전처리의 중요성에 대해 강조했었는데요, 그래서 가장 먼저 다시 생각해볼 부분도 전처리 입니당! 전처리 관련해서 다시 생각해볼 부분으로는, 바로 데이터의 구분입니다! 이 전까지 저희는 ‘기준 팀'을 두고, 같은 경기에 대해서 두 개의 행으로 나타내 왔어요. 예를 들어, 광주와 서울경기가 .. 2022. 8. 14. 이제 그만 XGBoost를 놓아주어야 할 때가 온 것 같아요… https://hyeoz.tistory.com/m/31 날씨, 요일, 경기장에 따라 XGBoost로 분석한 승부 예측 옛날 글 보니까 오랜만에 파이썬이 너무 하고싶어졌🥹 XGBoost가 내 미래도 예측해줬으면 좋겠다.. 안정적인 데이터 수집/관리 시스템을 갖춰가고 있는 현재, 저희는 경기력을 측정할 수 있는 저 hyeoz.tistory.com 앞선 저의 많은 포스팅에서 확인 가능하셨겠지만, 저는 회귀분석 모델로 XGBoost를 정말 자주 사용했어요! 특별히 좋아하는 이유가 있냐고 물으신다면, 저는 그저 잘 사용할 수 있는 모델이 그 뿐이라고 대답해 드리는게 인지상정…(feat. 로켓단) 하지만 회귀분석 모델에는 정말 많은 종류가 있고, 각각의 장단점이 있죠! 데이터에 따라 더 효과적인 모델도 있을거구요... 2022. 8. 10. 날씨, 요일, 경기장에 따라 XGBoost로 분석한 승부 예측 옛날 글 보니까 오랜만에 파이썬이 너무 하고싶어졌🥹 XGBoost가 내 미래도 예측해줬으면 좋겠다.. 안정적인 데이터 수집/관리 시스템을 갖춰가고 있는 현재, 저희는 경기력을 측정할 수 있는 저희만의 지수들과 경기를 예측할 수 있는 모델들을 연구하고 개발하고 있습니다! 그 중, 저는 파이썬의 XGBoost라는 부스팅 기법을 활용하여 승부를 예측할 수 있는 알고리즘 모델을 만들어 보았습니다! (설명봇 두둥등장) XGBoost란, eXtreme Gradient Boosting 의 약자로, 여러개의 약한 의사결정 나무를 조합하여 사용하는 앙상블 기법 중 하나인 부스팅을 이용하여 구현한 알고리즘이 병렬 학습이 지원되도록 구현한 라이브러리 입니다! 저는 Jupyter notebook을 사용하고 있고, 사내 SQL.. 2022. 8. 5. 이전 1 다음