Herramientas
Una selección guiada para trabajar con PLN: primero lo imprescindible, después lo que encaja con tu perfil y al final lo avanzado.
Categorías
Análisis lingüístico
Análisis morfosintáctico, NER y procesamiento lingüístico.
Herramientas para procesamiento lingüístico profundo: tokenización, lematización, etiquetado gramatical, análisis sintáctico y reconocimiento de entidades. Son la base del PLN clásico y siguen siendo útiles para análisis lingüístico directo.
spaCy
Librería industrial de NLP diseñada para producción, con pipelines eficientes y modelos preentrenados. Optimizada para velocidad y escalabilidad.
- ▪Velocidad optimizada (Cython)
- ▪Modelos para 70+ idiomas
- ▪Pipelines personalizables
NLTK
Natural Language Toolkit, la librería clásica educativa para aprender NLP y algoritmos tradicionales. Incluye WordNet y corpus.
- ▪Algoritmos clásicos completos
- ▪WordNet integrado
- ▪50+ corpus incluidos
FreeLing
Suite de análisis lingüístico multilingüe con soporte especializado para lenguas ibéricas y europeas. Calidad lingüística académica.
- ▪Multilingüe robusto
- ▪Análisis morfológico profundo
- ▪NER avanzado
Stanza
Librería de Stanford NLP con modelos neuronales para 70+ idiomas y calidad lingüística superior. Basada en Universal Dependencies.
- ▪Calidad académica
- ▪Modelos neuronales SOTA
- ▪Universal Dependencies
Sketch Engine
Plataforma web para análisis de corpus y lingüística computacional con interfaz gráfica. Ideal para explorar patrones sin programar.
- ▪Interfaz web completa
- ▪Concordancias y collocations
- ▪Word Sketches
UDPipe
Pipeline de análisis morfosintáctico entrenado en Universal Dependencies. Tokenización, tagging y parsing consistente.
- ▪Estándar Universal Dependencies
- ▪Tokenización y Parsing
- ▪Modelos preentrenados
Presidio
Herramienta de Microsoft para detección y anonimización automática de datos personales (PII) en texto.
- ▪Detección PII automática
- ▪Anonimización configurable
- ▪Modelos NER especializados
VADER
Analizador de sentimiento basado en reglas diseñado específicamente para redes sociales y texto informal.
- ▪Reglas léxicas especializadas
- ▪Detección intensidad emoción
- ▪Texto informal (emojis, slang)
Pandas
Librería fundamental de Python para manipulación y análisis de datos estructurados. Esencial para preprocessing de datos NLP.
- ▪DataFrames para datos tabulares
- ▪Manipulación datos eficiente
- ▪Integración NumPy
NumPy
Librería base para computación numérica en Python. Proporciona arrays multidimensionales y operaciones matemáticas eficientes.
- ▪Arrays multidimensionales
- ▪Operaciones vectorizadas rápidas
- ▪Funciones matemáticas completas