スキップグラムを生成

単語や文字のスキップを許可する柔軟なN-gramを作成します。

0単語 | 0文字
変更時に変換する
0 行 | 0 項目
読み取り専用モード

フレキシブルスキップ

隠れたパターンを見つけるためにスキップできる単語または文字の正確な数を定義

インスタント結果

処理はブラウザ内で即座に行われます。サーバーの遅延はありません。

単語と文字

単語スキップグラムと文字スキップグラムの両方をサポート

これらの例を試す

スキップ付き単語バイグラム

文から単語ペアの文脈を捉える1スキップの2グラムを生成

今すぐ適用

文字バイグラム

短いテキスト文字列から、1スキップの文字レベル2-gramを抽出します。

今すぐ適用

スキップ付き単語トライグラム

1スキップの3単語スキップグラムを作成し、より長い文脈パターンを見つけます。

今すぐ適用

ワイドスキップバイグラム

最大2スキップを許容する2-gramを探索し、より広い単語関係を調べます。

今すぐ適用

スキップグラムとは

スキップグラムは、n-gramの一般化であり、構成要素(単語や文字)が元のテキスト内で連続している必要はありません。代わりに、ギャップ(スキップ)で区切ることができます。

この用語は自然言語処理(NLP)で広く使用されており、特に Word2Vec のようなモデルでは、スキップグラムが単語が直接隣接していない場合でもその文脈を捉えるのに役立ちます。

k-skip-n-gramsの説明

このツールで使用される正式な定義は、k-skip-n-gramsです:

  • n: シーケンス内の項目数(単語/文字)。
  • k: シーケンス内の任意の2つの項目間でスキップできる最大項目数。

例えば、"The quick brown fox"という文では:

  • 通常のバイグラム (n=2, k=0): 「The quick」「quick brown」「brown fox」
  • 1-skip-2-grams(n=2、k=1): 上記に加えて「The brown」('quick'をスキップ)、「quick fox」('brown'をスキップ)を含みます。

このツールの使い方

  1. テキスト入力: コンテンツを貼り付けるか、ファイルをドラッグ&ドロップします。
  2. N(サイズ)を設定: グラムの長さ(例:2でペア)を選択します。
  3. K(スキップ数)を設定: 許可される最大スキップ距離を選択します。
  4. 結果を表示: ツールは条件を満たすすべての有効な部分列を生成します。