Dev/python15 회귀분석 모델링 오답노트 . txt 역시 돈내고 받는 데이터는 다른가.... 무료 api 로 데이터 받아서 옛날처럼 분석하려니 전처리 너무 빡세다,,, 근데 와이스카웃은 일반인한테 데이터 공개 안해주잖슴ㅜㅜ 지난 포스팅동안, 열심히 회귀분석 모델링을 공부해 온 저와 여러분! 한 단계 더 발전하기 위해 지금까지 진행해온 모델링을 복습하고 새롭게 수정할 부분을 짚고 넘어가도록 해요! 1. 학습/테스트 데이터 경기 기준 전처리 저는 항상 모델링을 진행하며 데이터 전처리의 중요성에 대해 강조했었는데요, 그래서 가장 먼저 다시 생각해볼 부분도 전처리 입니당! 전처리 관련해서 다시 생각해볼 부분으로는, 바로 데이터의 구분입니다! 이 전까지 저희는 ‘기준 팀'을 두고, 같은 경기에 대해서 두 개의 행으로 나타내 왔어요. 예를 들어, 광주와 서울경기가 .. 2022. 8. 14. 이제 그만 XGBoost를 놓아주어야 할 때가 온 것 같아요… https://hyeoz.tistory.com/m/31 날씨, 요일, 경기장에 따라 XGBoost로 분석한 승부 예측 옛날 글 보니까 오랜만에 파이썬이 너무 하고싶어졌🥹 XGBoost가 내 미래도 예측해줬으면 좋겠다.. 안정적인 데이터 수집/관리 시스템을 갖춰가고 있는 현재, 저희는 경기력을 측정할 수 있는 저 hyeoz.tistory.com 앞선 저의 많은 포스팅에서 확인 가능하셨겠지만, 저는 회귀분석 모델로 XGBoost를 정말 자주 사용했어요! 특별히 좋아하는 이유가 있냐고 물으신다면, 저는 그저 잘 사용할 수 있는 모델이 그 뿐이라고 대답해 드리는게 인지상정…(feat. 로켓단) 하지만 회귀분석 모델에는 정말 많은 종류가 있고, 각각의 장단점이 있죠! 데이터에 따라 더 효과적인 모델도 있을거구요... 2022. 8. 10. Pycaret.regression 같이 해봐요! 저번 주에 겨우겨우 설치했던 Pycaret, 기억하시나요? https://hyeoz.tistory.com/m/33 파란만장 pycaret 설치기 pip install pycaret error ideal-dominate.medium.com 이렇게 어렵게 설치한 친구인데, 100% 활용해봐야겠죠! 저희 DB에 있는 데이터를 활용해서 파이캐럿을 돌려보도록 하겠습니당 :) Pycaret.classification, pycaret.regression 중에서 저는 회귀분석을 통한 예측, regression을 사용해보았습니다! 0. 넣을 데이터 전처리 무작정 파이캐럿을 import 하기 전에, 넣을 데이터를 전처리해보도록 하겠습니다! 제가 항상 주장하는 전처리의 중요성, 제 글을 열심히 보시는 분들은 다들 알고 계시.. 2022. 8. 10. 파란만장 pycaret 설치기 / pip install pycaret error / 2022 업데이트..! 내가 블로그 글을 갑자기 옮기게 된 계기... 다시 파이썬 분석하려고 pycaret 설치했는데 에러 떠서 검색하니까 이 글이 제일 먼저 뜨더라ㅋㅋㅋㅋㅋ 사업 망한지가 언젠데 아직도 회사 블로그는 안없애고 있는건지.. 암튼 이 글은 2021년 6월 2일 글! 아주 작고 귀여운 표본으로 돌려본 XGBoost 이후로, Pycaret 이라는 라이브러리를 추천받았어요! https://minimin2.tistory.com/137 간단한 설명과 예제가 있는 링크를 보내주셔서, 즐거운 화요일에 머신러닝 공부를 해보기로 했습..분명히 그러려고 했는데요…! 경쾌한 타자로 패키지를 설치했더니 글쎄.. pip install pycaret Oh My God (세상아…나한테 이럴 수는 없는거다….) 수많은 빨간줄과…ERROR,,.. 2022. 8. 5. XGBoost는 과연 얼마나 정확했을까요? 역시 블로그에는 드립을 잔뜩 써줘야 속이 시원하지.. 아직 초반이라 선 지키는거 조금 어색해 (2021년 05월 31일 글!) 3월 모의고사 채점하는 고3의 마음으로 맞춰보았습니다.. 제가 지난 글에 포스팅했던 날씨, 요일, 홈구장에 따른 XGBoost 승부예측! 기억하시나요? 혹시, 정말 혹~시 안보셨던 분들을 위해 링크를 첨부합니다^_^ (https://hyeoz.tistory.com/31?category=965831) K리그 주말 6경기에 대한 예측을 진행했는데, 주말이 지나 월요일이 된 오늘! 우리 애기…아니아니 제 xgb 모델이 얼마나 정확하게 예측했을지 한 번 확인해보겠습니다! 예측 모델 돌려서 나왔던 최종 결과물 실제 승부 결과를 데이터 프레임 맨 끝에 추가하여 적중한 팀에는 Correct!.. 2022. 8. 5. 날씨, 요일, 경기장에 따라 XGBoost로 분석한 승부 예측 옛날 글 보니까 오랜만에 파이썬이 너무 하고싶어졌🥹 XGBoost가 내 미래도 예측해줬으면 좋겠다.. 안정적인 데이터 수집/관리 시스템을 갖춰가고 있는 현재, 저희는 경기력을 측정할 수 있는 저희만의 지수들과 경기를 예측할 수 있는 모델들을 연구하고 개발하고 있습니다! 그 중, 저는 파이썬의 XGBoost라는 부스팅 기법을 활용하여 승부를 예측할 수 있는 알고리즘 모델을 만들어 보았습니다! (설명봇 두둥등장) XGBoost란, eXtreme Gradient Boosting 의 약자로, 여러개의 약한 의사결정 나무를 조합하여 사용하는 앙상블 기법 중 하나인 부스팅을 이용하여 구현한 알고리즘이 병렬 학습이 지원되도록 구현한 라이브러리 입니다! 저는 Jupyter notebook을 사용하고 있고, 사내 SQL.. 2022. 8. 5. 이전 1 2 3 다음