Saltar al contenido
Recursos

Herramientas

Una selección guiada para trabajar con PLN: primero lo imprescindible, después lo que encaja con tu perfil y al final lo avanzado.

Categorías

📝Imprescindibles

Análisis lingüístico

Análisis morfosintáctico, NER y procesamiento lingüístico.

Herramientas para procesamiento lingüístico profundo: tokenización, lematización, etiquetado gramatical, análisis sintáctico y reconocimiento de entidades. Son la base del PLN clásico y siguen siendo útiles para análisis lingüístico directo.

💡 Cuándo usar:Úsalas para analizar corpus, extraer entidades, estudiar patrones morfosintácticos o preparar datos antes de entrenar modelos.
POPULAR

spaCy

LibreríaOpen Source

Librería industrial de NLP diseñada para producción, con pipelines eficientes y modelos preentrenados. Optimizada para velocidad y escalabilidad.

  • Velocidad optimizada (Cython)
  • Modelos para 70+ idiomas
  • Pipelines personalizables

NLTK

LibreríaOpen Source

Natural Language Toolkit, la librería clásica educativa para aprender NLP y algoritmos tradicionales. Incluye WordNet y corpus.

  • Algoritmos clásicos completos
  • WordNet integrado
  • 50+ corpus incluidos

FreeLing

SuiteOpen Source

Suite de análisis lingüístico multilingüe con soporte especializado para lenguas ibéricas y europeas. Calidad lingüística académica.

  • Multilingüe robusto
  • Análisis morfológico profundo
  • NER avanzado

Stanza

LibreríaOpen Source

Librería de Stanford NLP con modelos neuronales para 70+ idiomas y calidad lingüística superior. Basada en Universal Dependencies.

  • Calidad académica
  • Modelos neuronales SOTA
  • Universal Dependencies

Sketch Engine

Plataforma WebFreemium

Plataforma web para análisis de corpus y lingüística computacional con interfaz gráfica. Ideal para explorar patrones sin programar.

  • Interfaz web completa
  • Concordancias y collocations
  • Word Sketches

UDPipe

Librería / APIOpen Source

Pipeline de análisis morfosintáctico entrenado en Universal Dependencies. Tokenización, tagging y parsing consistente.

  • Estándar Universal Dependencies
  • Tokenización y Parsing
  • Modelos preentrenados

Presidio

LibreríaOpen Source

Herramienta de Microsoft para detección y anonimización automática de datos personales (PII) en texto.

  • Detección PII automática
  • Anonimización configurable
  • Modelos NER especializados

VADER

LibreríaOpen Source

Analizador de sentimiento basado en reglas diseñado específicamente para redes sociales y texto informal.

  • Reglas léxicas especializadas
  • Detección intensidad emoción
  • Texto informal (emojis, slang)
POPULAR

Pandas

LibreríaOpen Source

Librería fundamental de Python para manipulación y análisis de datos estructurados. Esencial para preprocessing de datos NLP.

  • DataFrames para datos tabulares
  • Manipulación datos eficiente
  • Integración NumPy
POPULAR

NumPy

LibreríaOpen Source

Librería base para computación numérica en Python. Proporciona arrays multidimensionales y operaciones matemáticas eficientes.

  • Arrays multidimensionales
  • Operaciones vectorizadas rápidas
  • Funciones matemáticas completas