참고 : https://tech.kakao.com/2023/06/05/languagemodel-mlm-clm/
언어모델의 원리와 만들기
언어모델 언어 모델(Language model)은 주어진 단어들의 시퀀스에 대해 임베딩 표현(Embedding representation) 또는 벡터(Embedding vector)를 만들어 줍니다. 언어 모델을 통해 만든 임베딩 표현으로 주제 찾기,
tech.kakao.com
언어모델
- 언어 모델은 주어진 단어들의 시퀀스에 대해 임베딩표현/임베딩벡터를 만들어줌
- 임베딩 표현으로 해결할 수 있는 문제
- 분류 문제 : 주제찾기, 감정분류, 개체명 인식 등
- 생성 문제 : 기계번역, 요약 등
- 대표적인 언어 모델 : GPT = Generative Pretrained Transformer
- ChatGPT, Copilot 등에 사용됨
- 매우 큰 모델에 수많은 데이터를 학습. GPT-3는 1750억개의 파라미터.
- 거대한 모델에 수많은 데이터를 사전학습 & 각 작업에 맞게 미세조정(fine-tuning) => 챗봇, 문서 자동완성 등의 서비스가 됨
- 사전훈련 모델
- 장점
- 다양한 분야의 지식이 포함되어 있어 범용성 높음
- 목표작업으로 미세조정을 하는데 작은 데이터셋으로도 가능
- 단점
- 특정 도메인에 맞게 맞춤화하는게 어려움
- 모델의 크기가 커서 많은 리소스 필요 (도메인에 맞는 작은 모델이 필요하면 직접 구축해야됨)
- 장점
- 대표적인 딥러닝 자연어 처리 기술
- Masked Language Model (MLM)
- Causal Language Model (CLM)
'기술 공부 끄적끄적 > 인공지능' 카테고리의 다른 글
딥러닝 자연어 처리 발전과정 (0) | 2024.03.04 |
---|---|
트레이닝 방법에 따라 나뉘는 CLM, MLM, Seq2Seq (0) | 2024.03.04 |
토크나이저란 (0) | 2024.03.02 |