일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 |
Tags
- 정보검색
- 스케줄러
- 가상메모리
- 랩실일기
- 컴파일러
- 자료구조
- 웹소프트웨어
- 오픈소스웹소프트웨어
- 클래스
- 데이터베이스
- 운영체제
- 파싱테이블
- 파싱
- 데이터분석
- css
- 도커
- 컴파일
- DB
- NLP
- Linear Algebra
- 836
- 프로세스
- 자연어처리
- 소프트웨어공학
- C언어
- docker
- React
- 객체지향설계
- OS
- 언어모델
Archives
- Today
- Total
observe_db
[용어] Perplexity 본문
논문 읽다가 perplexity라는 단어가 나왔다.
원문은 이러한데(The Era of 1-bit LLMs논문)
It matches the full-precision(i.e., FP16 or BF16) Transformer LLM with the same model size and training tokens in terms of both perplexity and end-task performance, while....
일단 perplexity의 사전적인 뜻은
: 혼란스러운 상태 또는 복잡하거나 어려운 상황이나 사물
일단 '당혹감', '복잡한 상황'등을 의미한다고 보여지는데,
'<당혹한 상황>과 최종 결과의 성능 측면에서..' 로 해석이 되버린다.
찾아본 결과는 자연어 처리 쪽에서 perplextiy라는 단어를 자체적인 용어로 사용하고 있었다.
(한 책에서는 PPL이라고 표현하기도 하는 듯)
사전적 뜻과 유사하게 (언어모델이 생성해야하는 단어가) 어느 정도로 헷갈리는지/혼동되는지를 나타내는 지표이고, 수가 작을 수록 성능이 좋음을 의미한다.
수식은 아래와 같다. 문장 W의 길이가 N일 때의 Perplexity를 구하는 공식이다.
다음과 같은 형태로도 나타낼 수 있다.
'Lab' 카테고리의 다른 글
[용어] Dice? (1) | 2024.05.08 |
---|---|
[랩실일기]논문 끝 시험 시작 (0) | 2023.10.13 |
[랩실일기] 이제 논문 끝..? (0) | 2023.10.10 |
[랩실일기] 예? 논문을 쓰라구요? (0) | 2023.07.19 |
[랩실의 지식] Class 다루기 (0) | 2023.04.28 |
Comments