Genereer Skip-grammen

Maak flexibele N-grammen die het overslaan van woorden of tekens mogelijk maken.

0 Woorden | 0 Tekens
Converteer bij wijziging
0 regels | 0 items
Alleen-lezen modus

Flexibele overslagen

Definieer precies hoeveel woorden of tekens kunnen worden overgeslagen om verborgen patronen te vinden.

Directe resultaten

De verwerking vindt direct plaats in uw browser. Geen serververtragingen.

Woord & Teken

Ondersteuning voor zowel Woord-skip-grammen als Karakter-skip-grammen.

Probeer Deze Voorbeelden

Woord Bigrammen met Overslaan

Genereer 2-grammen met 1-skip uit een zin om woordpaarcontext vast te leggen.

Nu toepassen

Karakterbigrammen

Extraheer 2-grams op teken-niveau met 1-skip uit een korte tekstreeks.

Nu toepassen

Woordtrigrammen met Overslaan

Maak 3-woord skip-grams met 1-skip om langere contextuele patronen te vinden.

Nu toepassen

Breed overslaan van bigrammen

Verken 2-grammen met maximaal 2 overslaan voor bredere woordrelaties.

Nu toepassen

Wat zijn skip-grams?

Een skip-gram is een generalisatie van een n-gram waarbij de componenten (woorden of tekens) niet opeenvolgend hoeven te zijn in de oorspronkelijke tekst. In plaats daarvan kunnen ze worden gescheiden door gaten (skips).

De term wordt veel gebruikt in Natural Language Processing (NLP), met name in modellen zoals Word2Vec, waarbij skip-grams helpen om de context van woorden vast te leggen, zelfs wanneer ze niet direct naast elkaar staan.

k-skip-n-grams Uitgelegd

De formele definitie die in deze tool wordt gebruikt is k-skip-n-grams:

  • n: Het aantal items (woorden/tekens) in de reeks.
  • k: Het maximale aantal items dat kan worden overgeslagen tussen twee willekeurige items in de reeks.

Bijvoorbeeld, in de zin "De snelle bruine vos":

  • Reguliere bigrammen (n=2, k=0): "The quick", "quick brown", "brown fox"
  • 1-skip-2-grams (n=2, k=1): Omvat het bovenstaande PLUS "The brown" ('quick' overgeslagen), "quick fox" ('brown' overgeslagen).

Hoe gebruik je deze tool

  1. Tekst invoeren: Plak uw inhoud of sleep een bestand.
  2. N (Grootte) instellen: Kies de lengte van het gram (bijv. 2 voor paren).
  3. K (Overslaan) instellen: Kies de maximale toegestane overslagafstand.
  4. Resultaten Bekijken: De tool genereert alle geldige deelreeksen die aan uw criteria voldoen.