개발
Transformer
murbachovski
2024. 4. 3. 09:20
Transformer
https://www.youtube.com/watch?v=6s69XY025MU
많은 Transformer 영상들을 봤는데 기본적인 구조를 가장 잘 설명해주는 영상이다.(참고로 재밌다.)
요즘은 매일 일찍 출근해서 한 시간 정도 논문 영상을 보고 있다.
우선 Transformer를 다시 꾸준히 공부합시다.
Positional Encoding : 입력 문장에서 순서 정보를 기억, 저장
MaskedMulti-Head Attention : decoder영역에서 추론해야하는 단어의 뒤 문장들은 사용하지 않도록 Masking 처리