본문 바로가기
둘/[ Machine Learning ]

Embedding(임베딩)

by Kieran_Han 2020. 12. 21.

자연어(인간의 언어)는 수치화되어 있지 않기 때문에 머신러닝, 딥러닝 기법을 적용할 수 없다.

이런 자연어 data를 처리하기 위해선 특정 추출을 통해 수치화를 해줘야 한다.

이 과정을 "언어의 벡터화"라고 한다.

 

가장 기본적인 언어의 벡터화 방법은 One-Hot Encoding이다.

' > [ Machine Learning ]' 카테고리의 다른 글

Tensorboad를 사용해 시각화하기  (0) 2020.12.23
Support Vector Regression  (0) 2020.12.22
Padding  (0) 2020.12.21
Scaler의 fit(), transform(), fit_transform()  (0) 2020.12.18
Data Scaling 종류  (0) 2020.12.18