학습 데이터(Train set) 전체의 80%비율로 학습 기계에게 인풋을 넣고 어떤 값이 나오는지 알려주는 데이터(교과서) 검증 데이터(Validation set) 학습 중인 모델 평가, 하이퍼파라미터를 조정하는데 사용되는 데이터셋 과적합을 감지함(모의고사) 테스트 데이터(Test set) 모델이 잘 학습되었는지 확인하기 위한 데이터(수능) 데이터 전처리 표준 스케일링: 피처별로 평균과 분산이 0과 1이 되도록 선형 변환하는 데이터 표준화 과정 기존 데이터가 정규분포를 따르는 경우 적합 최소-최대 스케일링: 피처별로 최솟값과 최댓값이 각각 0과 1이 되도록 선형 변환하는 데이터 표준화 과정 데이터의 최솟값과 최댓값이 명확하고 이상치가 없는 경우 적합 모델 선택 모수적 모델: 데이터가 특정 확률 분포를 따..