데이터 정제(Data Cleansing)’가 필요한 이유
‘데이터 정제(Data Cleansing)’가 필요한 이유 데이터 전처리 과정에서 ‘데이터 정제(Data Cleansing)’는 필수적으로 수행되어야 하는 단계 중 하나이며, 이는 결국 분석 결과의 신뢰성과 정확성, 그리고 활용 가능성을 극대화하기 위한 근간이 된다. 현대 사회에서 데이터는 방대하게 축적되고, 다양한 출처와 형식으로 생산되며, 분석에 활용되고 있다. 그러나 수집된 데이터는 종종 불완전하거나, 잘못된 형식으로 기록되어 있거나, 중복되어 있거나, 혹은 불규칙한 이상치(Outlier)를 포함하는 경우가 많다. 이러한 ‘지저분한’ 데이터는 그대로 분석 단계로 넘어가게 되면 분석 결과의 신뢰성을 훼손하고, 왜곡된 결론을 초래하며, 궁극적으로는 잘못된 의사결정을 유발할 수 있다. 따라서 데이터 정제..
강화학습
2024. 12. 19. 10:36