본문 바로가기
2/[ Machine Learning ]

Scaler의 fit(), transform(), fit_transform()

by Kieran_Han 2020. 12. 18.

fit( )

데이터 변환을 학습, 학습용 데이터에만 적용

 

transform( )

실제 data의 scale을 조정, 학습용 data와 test data에 적용

 

fit_transform( )

fit( )과 transform( )을 함께 수행하는 method.

기존의 fit( )과 transform( ) 각각 수행하는 번거로움을 줄임

 

하지만 Test Data에 fit.transform( )을 적용해서는 안된다. 이를 수행하면 scaler 객체가 기존에 학습 data에 fit했던 기준을 모두 무시하고 다시 Test Data를 기반으로 기준을 적용하기 때문이다.

이런 번거로움을 피하기 위해 Train과 Test Data로 나누기 전에 먼저 Scaling 등의 data 전처리를 해주는 것이 좋다.

' > [ Machine Learning ]' 카테고리의 다른 글

Embedding(임베딩)  (0) 2020.12.21
Padding  (0) 2020.12.21
Data Scaling 종류  (0) 2020.12.18
Chapter 1. 한눈에 보는 ML  (0) 2020.12.07
Scaling 종류  (0) 2020.12.06