N-gram 생성기란 무엇인가요?
N-gram 생성기는 주어진 텍스트 샘플에서 N개 항목의 연속 시퀀스로 텍스트를 분해하는 도구입니다. 이러한 항목은 응용 프로그램에 따라 음소, 음절, 문자, 단어 또는 염기쌍이 될 수 있습니다. 이 도구는 특히 단어 N-gram 및 문자 N-gram을 지원합니다.
N-gram의 일반적인 용도
- 텍스트 분석: 텍스트에서 단어 쌍(바이그램) 또는 세 쌍(트라이그램)의 빈도를 이해합니다.
- SEO: 키워드 밀도 분석 및 롱테일 키워드 조합 찾기.
- 표절 탐지: 공유된 N-gram 시퀀스를 기반으로 문서를 비교합니다.
- 예측 입력: 이전 N-1개 단어를 기반으로 다음 단어를 제안합니다.
- 암호학: 문자 빈도 패턴을 분석하여 암호를 해독합니다.
이 도구 사용 방법
- 텍스트 입력: 입력 영역에 콘텐츠를 붙여넣거나 파일을 업로드하세요.
- 단위 선택: "단어"(기본값) 또는 "문자" 중에서 선택하세요.
- N 값 설정: N-그램의 크기를 입력합니다(예: 2는 바이그램, 3은 트라이그램).
- 결과 보기: 생성된 N-그램이 출력 상자에 즉시 표시됩니다.