새소식

딥러닝/자연어 처리

[CS244n] RNN

  • -

언어 모델(language model)은 단어 시퀀스에 확률을 부여하는 모델이다.
확률을 부여한다는 것은 단어/문장을 선택하거나 생성해야 하는 경우 더 적절한 단어/문장을 선택하는데 사용될 수 있다는 것을 의미한다.
그렇기 때문에 음성 인식, 기계 번역등 언어와 관련된 여러 과제에서 널리 쓰이고 있다.

언어 모델은 처음에는 단순한 구조에서 출발하여 한계를 극복하기 위해 조금씩 발전하는 형태로 진화하고 있다.

 

 

 

 

 

 

 

 

 

 

 

728x90

'딥러닝 > 자연어 처리' 카테고리의 다른 글

[CS244n] Transformers & Pretraining  (0) 2022.05.31
[CS244n] Self-Attention & Transformer  (0) 2022.05.29
[CS244n] Machine Translation with Seq2Seq and Attention  (0) 2022.05.27
[CS244n] LSTM  (0) 2022.05.21
트랜스포머  (0) 2022.05.17
Contents