DeepLearning/NLP
음절, 형태소, 어절, 품사
꼬꼬마코더
2024. 8. 16. 15:08
728x90
- 음절: 가장 작은 말소리의 단위 - 한국어는 하나의 글자가 한 음절 EX) 한, 국, 어
- 형태소: 언어에서 의미를 가지는 가장 작은 단위 - 일반적으로 자연어 처리에서 분석의 기본이 되는 토큰
- EX) 한나가 책을 보았다.
- 의존성- 자립형태소: 한나, 책 / 의존형태소: 가,을,보,았,
- 의미여부 -실질형태소:한나, 책, / 형식형태소: 가, 을, 았,
- 어절: 한 개 이상의 형태소가 모여 구성된 단위, 자연언어는 어절단위로 띄어쓰기 되어 발화 또는 서술됨
- 품사: 품사는 단어를 문법상 의미, 형태, 기능에 따라 분류한 종별을 의미
- 역할: 체언, 용언,,
- 의미: 대명사, 명사, 동사 등
- 형태: 가변어, 불변어