일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 데이터베이스
- Linear Algebra
- Agile
- 836
- 운영체제
- 스케줄러
- C언어
- 컴파일
- 웹소프트웨어
- 데이터분석
- 가상메모리
- 객체지향설계
- 클래스
- DB
- css
- 파싱테이블
- OS
- React
- 소프트웨어공학
- 오픈소스웹소프트웨어
- NLP
- 정보검색
- 자연어처리
- 프로세스
- 파싱
- 랩실일기
- 애자일
- 벡터
- 컴파일러
- 언어모델
Archives
- Today
- Total
목록정보 검색 (1)
observe_db
[정보검색] 3. Dictionaries and tolerant retrieval
2. Dictionariesdictionary는 term vocabulary를 저장하는 자료 구조(term voca. = data, dictionary = data structure) 대표적인 자료구조 클래스-hash와 tree(정보검색도 둘다 사용.) Hashes각 vocabulary term은 배열의 행번호인 정수로 해싱됨.쿼리 시간: 고정길이 array에 위치장점: 빠르다.(상수 시간)단점: 마이너한 용어 찾기 어려움/prefix 찾을 수 없음/voca.가 커지면 모든걸 rehash Treesprefix 문제 해결가장 간단한 트리는 이진 트리O(log M)이라 느리긴 함(M이 voca.의 크기)그러나 최적상태는 B-tree(Balanced tree)로만 가능.Rebalancing 문제도 완화 가능...
학교 공부/정보검색(4-2)
2024. 10. 11. 15:59