일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 언어모델
- 컴파일러
- 836
- 소프트웨어공학
- 데이터베이스
- 애자일
- 오픈소스웹소프트웨어
- C언어
- 클래스
- 객체지향설계
- Agile
- 정보검색
- 운영체제
- css
- NLP
- 스케줄러
- 파싱
- 자연어처리
- Linear Algebra
- 가상메모리
- 데이터분석
- 컴파일
- OS
- DB
- 벡터
- React
- 랩실일기
- 웹소프트웨어
- 프로세스
- 파싱테이블
Archives
- Today
- Total
목록compression (1)
observe_db
[정보 검색] 5. Index Compression
2. CompressionWhy?적은 디스크 용량=>비용 절약메모리 절약=>속도 향상디스크->메모리간 데이터 전송 속도 향상단, 압축해제 알고리즘도 꽤 속도가 있어야함.(이게 느리면 의미가 없다) 왜 정보 검색에서?dictionary 고려- 메인메모리 사용을 줄일 수 있음posting-디스크 필요 공간 줄이고, 디스크를 읽는 시간도 줄임. Lossy와 lossless- Lossy는 손실이 있지만 많이 압축됨- lossless는 손실이 없음. 3. Term statisticsterm vocabulary의 크기는 얼마?(모든 웹페이지를 인덱싱하려 할 때에 collection의 크기는?)length 20에 최소 70^20(약 10의 37승)개의 다른 words가 존재.Heap's law: M = kT^bM:..
학교 공부/정보검색(4-2)
2024. 10. 18. 00:55