728x90 Stratified Random Sampling 썸네일형 리스트형 [04. Feature Sampling] 002. Stratified Random Sampling 데이터의 특성상 몇 개의 층(Strata)으로 나누어진 데이터의 경우는 동일한 확률로 뽑는 것보다 층간의 비율에 맞춰 각 층 안에서 표본을 뽑는 것이 낫다. 모든 데이터에서 표본을 뽑는 경우 특정층이 뽑히지 않거나 소수로 뽑힐 확률도 있기 때문이다. 각 층 내에서 동질적이고 유사한 개체들로 묶여있는 데이터 집단에서는 층화추출이 단순확률추출보다 더 효율적이다. import pandas as pd import pandas as pd from sklearn.model_selection import StratifiedShuffleSplit if __name__ == '__main__': data = [{'이름': '영수', '분야': '언어', '국어': 100, '영어': 90, '수학': 50, '과학': .. 더보기 이전 1 다음