Skip-Gramme generieren

Erstellen Sie flexible N-Gramme, die das Überspringen von Wörtern oder Zeichen ermöglichen.

0 Wörter | 0 Zeichen
Bei Änderung konvertieren
0 Zeilen | 0 Elemente
唯讀模式

Flexible Überspringungen

Legen Sie genau fest, wie viele Wörter oder Zeichen übersprungen werden können, um versteckte Muster zu finden.

Sofort-Ergebnisse

Die Verarbeitung erfolgt sofort in Ihrem Browser. Keine Serververzögerungen.

Wort & Zeichen

Unterstützung für sowohl Wort-Skip-Gramme als auch Zeichen-Skip-Gramme.

試試這些範例

Wort-Bigramme mit Überspringen

Generieren Sie 2-Gramme mit 1-Skip aus einem Satz, um den Kontext von Wortpaaren zu erfassen.

Jetzt anwenden

Zeichen-Bigramme

Zeichenbasierte 2-Gramme mit 1-Skip aus einer kurzen Textzeichenfolge extrahieren.

Jetzt anwenden

Wort-Trigramme mit Überspringen

Erstelle 3-Wort-Skip-Gramme mit 1-Skip, um längere kontextuelle Muster zu finden.

Jetzt anwenden

Breite Bigramme überspringen

Erkunden Sie 2-Gramme mit bis zu 2 Auslassungen für breitere Wortbeziehungen.

Jetzt anwenden

Was sind Skip-Gramme?

Ein Skip-Gramm ist eine Verallgemeinerung eines N-Gramms, bei dem die Komponenten (Wörter oder Zeichen) im Originaltext nicht aufeinanderfolgen müssen. Stattdessen können sie durch Lücken (Skips) getrennt sein.

Der Begriff wird häufig in der Verarbeitung natürlicher Sprache (NLP) verwendet, insbesondere in Modellen wie Word2Vec, bei denen Skip-Grams helfen, den Kontext von Wörtern zu erfassen, auch wenn diese nicht unmittelbar benachbart sind.

k-Skip-n-Gramme erklärt

Die formale Definition, die in diesem Tool verwendet wird, ist k-skip-n-grams:

  • n: Die Anzahl der Elemente (Wörter/Zeichen) in der Sequenz.
  • k: Die maximale Anzahl von Elementen, die zwischen zwei beliebigen Elementen in der Sequenz übersprungen werden können.

Zum Beispiel im Satz „Der schnelle braune Fuchs“:

  • Reguläre Bigramme (n=2, k=0): "The quick", "quick brown", "brown fox"
  • 1-Skip-2-Gramme (n=2, k=1): Enthält zusätzlich „The brown“ (übersprungenes „quick“), „quick fox“ (übersprungenes „brown“).

Wie verwende ich dieses Tool?

  1. Text eingeben: Fügen Sie Ihren Inhalt ein oder ziehen Sie eine Datei per Drag & Drop.
  2. N-Gramm-Größe festlegen (N): Wählen Sie die Länge des Gramms (z. B. 2 für Paare).
  3. K (Sprünge) festlegen: Wählen Sie die maximal zulässige Sprungdistanz.
  4. Ergebnisse anzeigen: Das Tool generiert alle gültigen Teilsequenzen, die Ihren Kriterien entsprechen.