트위터 텍스트 데이터 전처리할 때 주의할 점
트위터(X) 데이터는 일반 텍스트 데이터와 비교했을 때 여러 면에서 독특하고 복잡한 특성을 가지고 있습니다. 짧은 글자 수로 구성되어 있어 문장 구조가 간결하거나 불완전한 경우가 많고, 독특한 인터넷 은어와 문법이 혼재되어 있습니다. 여기에 해시태그(#), 멘션(@), URL, 그리고 이모지 같은 다양한 특수 문자들이 자연스럽게 섞여 있어, 일반적인 텍스트 전처리 방식만으로는 그 의미와 특성을 충분히 살리기 어렵습니다. 이러한 … 더 읽기