Embedding 계층이란? : Word2vec을 개선하는 2가지 방법

구현한 CBOW 모델은 말뭉치가 커지면, 계산량이 매우 많아집니다. 그래서 2가지 개선을 합니다. 첫번째, Embedding이라는 계층을 도입한다. 두번째, 네거티브 샘플링 이라는 새로운 손실함수를 사용한다. 이 두가지 개선으로 진짜 실제로 사용하는 word2vec이 완성됩니다. Embedding계층으로 word2vec 개선 어휘가 100만단어고, 은닉층이 100개인 CBOW모델을 생각해보자 위와 같은 신경망은 학습 시 너무 많은 시간과 자원이 소요된다. 원핫의 메모리가 너무 커진다. 100만 … Embedding 계층이란? : Word2vec을 개선하는 2가지 방법 계속 읽기