데이터 전처리에서 '이상치 처리'가 중요한 이유
데이터 전처리에서 '이상치 처리'가 중요한 이유 데이터 전처리 과정에서 이상치 처리가 필요한 이유는 이상치가 여러 머신 러닝 모델과 통계 분석의 성능과 신뢰성에 큰 영향을 미칠 수 있기 때문이다. 그래서 다음과 같은 이유로 ‘이상치 처리’가 중요한 것이다. 1. 통계적 측정에 대한 영향평균과 표준편차: 이상치는 데이터셋의 평균과 표준편차에 큰 영향을 줄 수 있다. 평균은 다양한 계산에서 사용되기 때문에, 이상치가 있으면 이 값이 왜곡되어 잘못된 결론을 도출할 수 있다. 마찬가지로, 데이터의 분포를 나타내는 표준편차도 이상치로 인해 과대평가될 수 있어 실제보다 더 넓은 범위로 보이게 한다.상관관계와 공분산: 이상치는 상관관계와 공분산 계산에 영향을 미쳐 변수 간 관계를 잘못 해석하게 만들 수 있다. 예를 ..
강화학습
2024. 8. 22. 10:11