Generar Skip-grams

Crear N-gramas flexibles que permitan omitir palabras o caracteres.

0 Palabras | 0 Caracteres
Convertir al cambiar
0 líneas | 0 elementos
Modo de solo lectura

Saltos Flexibles

Definir exactamente cuántas palabras o caracteres se pueden omitir para encontrar patrones ocultos.

Resultados Instantáneos

El procesamiento ocurre instantáneamente en su navegador. Sin demoras del servidor.

Palabra y carácter

Compatibilidad con skip-gramas de palabras y skip-gramas de caracteres.

Prueba Estos Ejemplos

Bigramas de palabras con salto

Generar 2-gramas con 1-skip a partir de una oración para capturar el contexto de pares de palabras.

Aplicar Ahora

Bigramas de Caracteres

Extraer bigramas a nivel de caracteres con 1 salto de una cadena de texto corta.

Aplicar Ahora

Trigramas de Palabras con Omisión

Crea skip-gramas de 3 palabras con 1 salto para encontrar patrones contextuales más largos.

Aplicar Ahora

Omitir bigramas anchos

Explorar bigramas permitiendo hasta 2 saltos para relaciones de palabras más amplias.

Aplicar Ahora

¿Qué son los Skip-gramas?

Un skip-gram es una generalización de un n-grama donde los componentes (palabras o caracteres) no necesitan ser consecutivos en el texto original. En cambio, pueden estar separados por espacios (saltos).

El término se usa ampliamente en Procesamiento del Lenguaje Natural (PLN), particularmente en modelos como Word2Vec, donde los skip-grams ayudan a capturar el contexto de las palabras incluso cuando no están inmediatamente adyacentes.

Explicación de k-skip-n-grams

La definición formal utilizada en esta herramienta es k-skip-n-grams:

  • n: El número de elementos (palabras/caracteres) en la secuencia.
  • k: El número máximo de elementos que se pueden omitir entre dos elementos cualesquiera en la secuencia.

Por ejemplo, en la frase "El rápido zorro marrón":

  • Bigramas Regulares (n=2, k=0): "The quick", "quick brown", "brown fox"
  • 1-skip-2-gramas (n=2, k=1): Incluye lo anterior más "The brown" (saltando 'quick'), "quick fox" (saltando 'brown').

Cómo usar esta herramienta

  1. Ingresar texto: Pega tu contenido o arrastra y suelta un archivo.
  2. Establecer N (Tamaño): Elija la longitud del grama (por ejemplo, 2 para pares).
  3. Establecer K (Saltos): Elija la distancia máxima de salto permitida.
  4. Ver Resultados: La herramienta genera todas las subsecuencias válidas que cumplen con tus criterios.