일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- Agile
- 애자일
- 컴파일
- C언어
- 가상메모리
- 언어모델
- 클래스
- css
- 정보검색
- 파싱테이블
- 836
- 소프트웨어공학
- 컴파일러
- 자연어처리
- 파싱
- 프로세스
- NLP
- Linear Algebra
- 운영체제
- 오픈소스웹소프트웨어
- 벡터
- DB
- React
- 스케줄러
- 웹소프트웨어
- 랩실일기
- 데이터베이스
- OS
- 객체지향설계
- 데이터분석
Archives
- Today
- Total
목록거대언어모델 (1)
observe_db
[NLP] 14. 거대 언어 모델(LLM)
1. 사전 학습과 토큰화거대 언어 모델LSTM이나 Transformer등을 쌓아 언어 모델의 크기를 확장한 것(수백 M~T)일반적인 NLP TASK 성능 대폭 향상QnA 뿐 아니라 대화형 가능학습데이터 부족 문제: 학습량 및 미등록어 처리Pre-training: 학습 데이터 부족을 해결하기 위한 기초적 학습.대규모 원시 텍스트(raw text)를 이용하여 학습(self-supervised learning)모델이 일반적 언어를 처리할 수 있도록 초기화모델의 파라미터 초기값은 성능에 매우 중요사전 학습 후 fine tuning으로 성능 향상예시다음 단어 예측/빈칸 예측/단어 순서/바뀐 단어 맞추기/다음 문장 예측/ 문장 순서 예측단어 토큰화: 단어를 통계에 기반한 sub-word(토큰)으로 분리하여 미등록어..
학교 공부/자연언어처리(4-2)
2024. 11. 28. 20:54