Tareas de PLN
Un recorrido por las tareas del procesamiento del lenguaje natural: qué problema lingüístico resuelven, cómo se modelan y dónde aporta criterio una persona lingüista.
El Procesamiento del Lenguaje Natural (PLN) abarca un amplio espectro de tareas que permiten a las máquinas entender, interpretar y generar lenguaje humano. Cada tarea tiene sus propios desafíos, técnicas y aplicaciones.
Desde los primeros sistemas basados en reglas hasta los modelos actuales con cientos de miles de millones de parámetros, el PLN ha experimentado una evolución extraordinaria. Los Transformers (2017) marcaron un antes y un después, permitiendo avances sin precedentes en todas las tareas.
Tareas donde tu formación lingüística pesa
Antes de pensar en modelos, conviene reconocer qué fenómeno del lenguaje está en juego.
Anotación y corpus
Diseñar etiquetas, guías y acuerdos entre anotadores para que los datos sean fiables.
NER y extracción
Identificar entidades, relaciones y términos relevantes sin perder contexto de dominio.
Parsing y sintaxis
Representar dependencias, constituyentes y ambigüedades estructurales.
Lematización y morfología
Reducir formas flexivas sin borrar información gramatical útil.
Coreferencia
Resolver quién es quién en el discurso, incluso cuando las menciones están lejos.
Terminología
Crear glosarios, detectar variantes y mantener consistencia en dominios especializados.
Explora las tareas
Cada área combina fenómenos lingüísticos, decisiones de datos, herramientas y criterios de evaluación.
Traducción automática
Convierte texto de un idioma a otro cuidando significado, registro, terminología y adecuación cultural.
Tecnologías del habla
Reconocimiento automático de voz, síntesis de voz y análisis de fenómenos orales como acento, prosodia y variación.
Generación de texto
Resumen, paráfrasis, completado y generación abierta con atención a coherencia, registro, factualidad y estilo.
Clasificación de textos
Categorización temática, análisis de sentimiento, detección de toxicidad y clasificación con etiquetas bien definidas.
Pregunta-respuesta (QA)
Sistemas extractivos, generativos y conversacionales que responden preguntas usando contexto, documentos o conocimiento.
Áreas emergentes
Multimodalidad, razonamiento, adaptación a dominio, explicabilidad y evaluación crítica de modelos de lenguaje.

¿Cómo usar esta sección?
Tres pasos para aprovechar al máximo cada área
Comprende
Identifica el problema lingüístico: ambigüedad, variación, estructura, significado, intención o calidad textual
Visualiza
Observa cómo el texto se transforma en etiquetas, tokens, vectores, hipótesis o respuestas
Aplica
Prueba herramientas, revisa errores y evalúa si la salida respeta el fenómeno lingüístico original
¿Por dónde empezar?
Si eres nuevo en PLN, te recomendamos comenzar con Clasificación de Textos y Generación de Texto, ya que son las tareas más fundamentales y te darán una base sólida para entender las demás.
