生成 跳躍詞組

建立可跳過單字或字元的彈性 N-gram。

0 個單詞 | 0 字元
變更時轉換
0 行 | 0 項目
唯讀模式

彈性跳過

精確定義可跳過多少個單詞或字元以找出隱藏模式。

即時結果

處理過程在您的瀏覽器中即時完成,無伺服器延遲。

字詞與字元

支援詞彙跳躍 N-gram 與字元跳躍 N-gram。

試試這些範例

跳過字詞雙詞組

從句子中生成帶1次跳躍的2-gram,以捕捉單詞對的上下文。

立即套用

字元雙連詞

從簡短文字字串中提取跳過 1 個字元的字元級 2-gram。

立即套用

跳躍三字詞組

建立跳過1個詞的3詞跳躍式n-gram,以找出更長的上下文模式。

立即套用

寬跳過雙詞組

探索允許最多跳過2個詞的2-gram,以擴展詞彙關聯

立即套用

什麼是跳躍式詞組?

一個跳躍語法是n-gram的推廣形式,其中組成部分(單詞或字元)在原始文字中不必連續,而是可以透過間隔(跳躍)分隔。

此術語廣泛應用於自然語言處理(NLP),特別是在像 Word2Vec 這樣的模型中,跳躍式語法(skip-grams)有助於捕捉單詞的上下文,即使它們並非直接相鄰。

K-Skip-N-Grams 說明

此工具使用的正式定義為k-跳過-n-gram

  • 項目數量:序列中的項目(單詞/字元)數量。
  • 跳過間距:序列中任意兩個項目之間可跳過的最大項目數量。

例如,在句子「The quick brown fox」中:

  • 標準二元組(n=2, k=0): 「The quick」、「quick brown」、「brown fox」
  • 1-跳過-2-元組(n=2, k=1): 包含上述內容,再加上「The brown」(跳過 'quick')、「quick fox」(跳過 'brown')。

如何使用此工具

  1. 輸入文字: 貼上您的內容或拖放檔案。
  2. 設定 N(大小): 選擇語法單元的長度(例如:2 表示成對)。
  3. 設定 K(跳過次數): 選擇允許的最大跳過距離。
  4. 檢視結果: 生成的 N-gram 會立即顯示在輸出框中。