텍스트 빅데이터
텍스트는 가장 대표적인 정보의 저장 단위이다. 텍스트 빅데이터 기반의 서비스로는 텍스트 요약, 텍스트의 분류, 감성 분석, 의미연결망 분석, 기계번역, 질의응답, 챗봇, 음성인식 등이 있다. 텍스트 빅데이터의 핵심은 이에 내포하고 있는 의미를 얼마나 뚜렷하게 분석해 낼 수 있는지이다. 텍스트는 기본적으로 명목 데이터이다. 하지만 의미나 관계에 따라서 요일, 반어의 빈도, 동의어, 반대어 등은 비명목 데이터로 볼 수도 있다. 텍스트 데이터를 사용하기 위해서는 텍스트 내에서 주요한 단어를 찾아내는 과정을 거쳐야 하는데 이를 텍스트 프로세싱이라고 한다. 텍스트 분석의 일환인 텍스트 프로세싱은 간단히 말하면 텍스트에서 의미 있는 정보를 찾아내는 것이다. 사실 언뜻 보면 자연어 처리와 비슷해 보인다. 자연어 처리..
2024. 1. 15.