Table of Contents

DeepLearning/NLP

음절, 형태소, 어절, 품사

꼬꼬마코더 2024. 8. 16. 15:08
728x90
  • 음절: 가장 작은 말소리의 단위  - 한국어는 하나의 글자가 한 음절 EX) 한, 국, 어
  • 형태소: 언어에서 의미를 가지는 가장 작은 단위 - 일반적으로 자연어 처리에서 분석의 기본이 되는 토큰
    • EX) 한나가 책을 보았다.
    • 의존성- 자립형태소: 한나, 책 / 의존형태소: 가,을,보,았,
    • 의미여부 -실질형태소:한나, 책,  / 형식형태소: 가, 을, 았, 
  • 어절: 한 개 이상의 형태소가 모여 구성된 단위, 자연언어는 어절단위로 띄어쓰기 되어 발화 또는 서술됨
  • 품사: 품사는 단어를 문법상 의미, 형태, 기능에 따라 분류한 종별을 의미
    • 역할: 체언, 용언,,
    • 의미: 대명사, 명사, 동사 등
    • 형태: 가변어, 불변어