O Que São Skip-gramas?
Um skip-gram é uma generalização de um n-grama onde os componentes (palavras ou caracteres) não precisam ser consecutivos no texto original. Em vez disso, eles podem ser separados por lacunas (pulos).
O termo é amplamente usado em Processamento de Linguagem Natural (PLN), particularmente em modelos como Word2Vec, onde skip-grams ajudam a capturar o contexto das palavras mesmo quando não estão imediatamente adjacentes.
k-skip-n-grams Explicado
A definição formal usada nesta ferramenta é k-skip-n-grams:
- n: O número de itens (palavras/caracteres) na sequência.
- k: O número máximo de itens que podem ser pulados entre quaisquer dois itens na sequência.
Por exemplo, na frase "A rápida raposa marrom":
- Bigramas Regulares (n=2, k=0): "The quick", "quick brown", "brown fox"
- 1-skip-2-grams (n=2, k=1): Inclui o acima mais "The brown" (pulou 'quick'), "quick fox" (pulou 'brown').
Como usar esta ferramenta
- Inserir texto: Cole seu conteúdo ou arraste e solte um arquivo.
- Definir N (Tamanho): Escolha o comprimento do grama (ex.: 2 para pares).
- Definir K (Pulos): Escolha a distância máxima de pulo permitida.
- Ver Resultados: A ferramenta gera todas as subsequências válidas que atendem aos seus critérios.