Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
Tags
- 정칙행렬
- 역행렬
- DataFrame
- ReLU
- word embedding
- Linear Algebra
- word2vec
- 신경망 학습
- 연립일차방정식
- 밑바닥부터 시작하는 딥러닝
- one-hot vector
- sigmoid
- NMT
- 선형대수학
- SVD
- 프로그래머를 위한 선형대수
- pandas
- 동시발생 행렬
- 판다스
- 자연어처리
- 딥러닝
- 데이터프레임
- machine translation
- RNN
- NLP
- 벡터간 유사도
- Transformer
- PPMI
- 밑바닥부터 시작하는 딥러닝2 2장
- Python
Archives
- Today
- Total
목록word2vec algorithm (1)
생각하는감자

one-hot vector라는 것은 관련된 것만 1로 표현하고 다른것은 모두 0으로 표현하는 형태의 벡터를 의미한다. 예를들어, 혈액형 4가지를 표현한다고 하면,, A형, B형, AB형, O형이 있을때 각각을 1, 2, 3, 4 등의 숫자로 표현하면 어쩔 수 없이 분류간의 대소관계가 생기게 된다. 이를 범주형 변수라고도 하는데, 이를 word 를 embedding 하는 데에 사용하기에는 적합하지 않다. 대신, A형을 [1 0 0 0], B형을 [0 1 0 0] 의 형태로 표현한다면 대소관계를 만들지 않고 분류할 수 있게 되고 이때 [1 0 0 0]과 같은 벡터를 one-hot vector라고 하는 것이다. Word2Vec Algorithm 기본적인 아이디어는 coaccurance에 비례하여 벡터간의 거리..
NLP
2023. 1. 5. 16:09