Cosa Sono gli Skip-gram?
Un skip-gram è una generalizzazione di un n-gramma in cui i componenti (parole o caratteri) non devono essere consecutivi nel testo originale. Possono invece essere separati da spazi vuoti (salti).
Il termine è ampiamente utilizzato nell'Elaborazione del Linguaggio Naturale (NLP), in particolare in modelli come Word2Vec, dove i skip-gram aiutano a catturare il contesto delle parole anche quando non sono immediatamente adiacenti.
k-skip-n-grams Spiegato
La definizione formale utilizzata in questo strumento è k-skip-n-grams:
- n: Il numero di elementi (parole/caratteri) nella sequenza.
- k: Il numero massimo di elementi che possono essere saltati tra due elementi qualsiasi nella sequenza.
Ad esempio, nella frase "The quick brown fox":
- Bigrammi regolari (n=2, k=0): "The quick", "quick brown", "brown fox"
- 1-skip-2-grammi (n=2, k=1): Include quanto sopra PIÙ "The brown" (saltato 'quick'), "quick fox" (saltato 'brown').
Come utilizzare questo strumento
- Inserisci testo: Incolla il tuo contenuto o trascina e rilascia un file.
- Imposta N (Dimensione): Scegli la lunghezza del gramma (ad esempio, 2 per le coppie).
- Imposta K (Salti): Scegli la distanza massima di salto consentita.
- Visualizza risultati: Lo strumento genera tutte le sottosequenze valide che soddisfano i tuoi criteri.