일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 오픈소스웹소프트웨어
- 랩실일기
- 파싱테이블
- 프로세스
- 컴파일러
- C언어
- css
- 클래스
- Linear Algebra
- 소프트웨어공학
- 자연어처리
- 컴파일
- 스케줄러
- Agile
- 파싱
- 데이터베이스
- 운영체제
- 벡터
- NLP
- 웹소프트웨어
- 가상메모리
- 애자일
- 언어모델
- OS
- React
- 객체지향설계
- DB
- 데이터분석
- 836
- 정보검색
Archives
- Today
- Total
목록단어 벡터 (1)
observe_db
[NLP] 11. 단어 벡터
11/7 단어 임베딩(word Embedding): 문자를 숫자들의 배열인 벡터로 변환하는 방법: 또는 그러한 방법으로 만들어진 단어 벡터.단어벡터-단어사이의 관계(의미)를 나타냄. 단어 임베딩의 목표쉽게 확보할 수 있는 대량의 원시 말뭉치를 통해비지도 학습(self-supervised learning)을 하고다양한 NLP 시스템에서 범용적으로 사용할 수 있는 단어 벡터를 만드는 것One-hot Encoding: 학습 데이터에 존재하는 단어들을 수집하여 vocabulary 구축.단어들의 등장 빈도순으로 순열 부여.vocabulary의 크기(=|V|)가 매우 크므로 매우 큰 차원의 sparse vector가 필요하다.*정보검색에서 나오는 'term'의 수를 5M 정도로 잡는다.단어의 의미간 관계를 표현할..
학교 공부/자연언어처리(4-2)
2024. 11. 8. 14:46