예측 모델링은 다양한 처리 방법이 있다. 실제 현업에서 데이터 분석 및 ML 업무를 수행하면서 마주한 문제 중 하나가 “결측 데이터" 이슈였다. 이를 해결하기 위해 근접한 값을 넣어주거나, 평균값을 넣어주거나, 또는 해당 일자의 데이터를 삭제하는 여러 방법이 있다.
✓ 결측값 제거
pandas의 drop을 이용해 쉽게 제거
✓ 결측값 채워넣기
대치법
보간법(Interpolation)
보간법이란? 통계적 혹은 실험적으로 구해진 데이터들(xi)로부터,주어진 데이터를 만족하는 근사 함수(f(x))를 구하고,이 식을 이용하여 주어진 변수에 대한 함수 값을 구하는 일련의 과정
선형 보간법
주어진 두 점을 이은 직선의 방정식을 근사 함수로 사용
라그랑제 보간법
점들을 지나는 곡선으로 연결하는 방법을 사용한다. 여러 개의 점들이 주어졌을 경우, 이들 점들을 지나는 다항식을 구하고, 이 다항식을 사용하여 주어진 점에 대한 보간 값을 구한다.