observe_db

[NLP]1. 자연어처리 개요 본문

학교 공부/자연언어처리(4-2)

[NLP]1. 자연어처리 개요

쩡윤 2024. 10. 3. 15:59

1. 자연어 처리 정의

자연어

: 일상에서 자연적으로 발생되어 사용하는 인간 언어(ex. 한국어, 영어, 중국어..)

: 형식이 자유롭기 때문에 컴퓨터가 바로 이해하기 어려움

: 자연언어라고도 함

 

인공어(인공 언어)

: 프로그래밍 언어와 같이 사람이 의도나 목적에 따라 만든 언어

: 형식이 명확하여 컴퓨터(+컴파일러)가 바로 이해하여 처리 가능

 

자연어 처리(Natural Language Processing, NLP)

: 자연어를 전산 공학적 측면에서 분석하고 이를 활용하는 일

: 경우에 따라 자연어 이해(Natural Language Understanding, NLU)와 자연어 생성(Natural Language Generation, NLG)의 융합으로도 본다.

: ex. 형태소 분석, 구문 분석, 문서 교정, 기계 번역 등

 

언어학(Linguistics): 인간이 세상을 자연어로 모델링하는 방법을 연구

 

전산언어학(Computational Linguistics): 언어학의 한 분야로 사람이 언어를 어떻게 처리(모델링)하는가를 주로 연구

 

 

2. 언어 처리 규칙의 한계

언어의 모호성(Ambiguity)-

  • 어휘, 구, 의미 수준 등
  • 단어 의미의 모호성
    • 배를 타다/배가 아프다/배를 먹다/배를 사다/배로 갚겠다.
  • 문장의 모호성
    • Stolen painting was found by tree
    • 아름다운 꽃과 아이<--꽃과 아이 모두 아름다운 건지, 아니면 꽃만 아름다운건지. (중의성)

 

언어의 규칙성

: 단어나 문장 등 작은 문법 단위들이 갖는 구조적 특성

: 같은 패턴이 반복되면 비슷한 의미로 유추 가능

 

규칙의 예외

  • 복수표현
    • 규칙: 복수표현은 -s,나 -es를 붙인다.
    • 예외: child->children, goose->geese, fish, woman->women
  • 시제 표현
    • 규칙(영): 과거형은 -ed
    • 예외: eat->ate, run->ran, 
  • 의미 변화
    • give me a hand: 도움을 요청하는 말.or 정말로 손을 달라는 말.(아이언맨3 대사)
    • 상황에 따라 의미가 변화함.

 

언어의 유연성

  • 신조어, 구조어, 의미 변화: 단어가 생기고, 사라지고, 의미가 확대/축소되고, 변화함.
    • ex1) '어리다'가 중세국어에는 어리석다는 느낌이라면, 현재는 나이가 적은.
    • ex2)'하다'가 많다인 시절도 있다.
  • 문맥에 따라 변화하는 단어 의미
    • 품사에 따라, 상황에 따라

 

 
 
Comments