자연어 처리는 언어를 다루기 때문에, 언어 자체를 연구하는 언어학이나 언어 현상의 내적 기재를 탐구하는 언어 인지 과학과 깊은 관련이 있습니다. 수학, 통계 도구는 구현을 위해 널리 사용되며, 이 과정에서 인사이트를 얻기 위해 시각화가 필요한 경우도 있습니다.
기존에 시각화 기능을 포함하는 한국어 자연어처리 오픈소스는 없었습니다. 한국어 전처리는 다른 언어보다 특히 더 어려우며, 초보 개발자들은 경험이 부족하기 때문에 라이브러리를 이용하기도 쉽지 않습니다. 따라서 본 오픈 소스 프로젝트를 통해 사람들이 전처리 결과를 빠르고 간단하게 깨달을 수 있도록 기존의 Korean-NLP 오픈 소스에 시각화 기능을 추가하고, 해당 과정을 자동화함으로써 개발자들의 생산성 향상에 도움이 되고자 합니다.
Since the subject of natural language processing is language, of course, it is deeply related to linguistics that study language itself and language cognitive science that explores the inner description of language phenomena. Mathematical and statistical tools are widely used for implementation, and also visualization is sometimes required to obtain insights in this process.
We found that there is no Korean NLP open source library which includes visualization. Korean language preprocessing has more difficulties than other languages. Especially for novice developers, it is difficult to use the library easily because they are inexperienced. So we’re trying to add visualization to the existing Korean-NLP open source, so that people can realize the preprocessing results fast and briefly. We expect that automating the process would greatly help in improving people's productivity.