언더샘플링1 [Data Science] 데이터의 편향 완화 전략 : 데이터 균형화 (오버샘플링 & 언더샘플링) 일반적으로 우리는 데이터를 수집해야하는 상황보다 다른 기관에서 데이터를 받아 분석하는 경우가 더 많습니다.그러나 그렇게 받은 데이터에 클래스 불균형이 존재한다면? 편향이 발생하게 되겠죠.. 그래서 우리는 이러한 클래스 불균형을 해소할 수 있는 방법을 알고 있어야합니다.대표적으로는 이렇게 두 가지가 있습니다.오버 샘플링언더 샘플링많이 들어보셨죠?이것들이 각각 어떤 것인지, 단점은 무엇인지 알아보고,각 샘플링에는 대표적으로 어떤 방법들이 있는지 한번 알아보도록 하죠!📌 오버 샘플링 오버 샘플링이란, 소수 클래스의 데이터를 늘리는 것을 말합니다.데이터가 상대적으로 적은 클래스를 증폭시켜 클래스 불균형을 해소할 수 있지만,노이즈가 증폭될 가능성이 있다는 단점이 있습니다. 이제 대표적인 오버 샘플링 방법들을 살.. 2024. 12. 5. 이전 1 다음