WER (Word Error Rate)
IntermedioMétricas
Métrica para evaluar sistemas de reconocimiento de voz (ASR). Mide errores de sustitución, borrado e inserción dividido por palabras totales. Menor WER = mejor. WER <5% es calidad humana.
Word2Vec
IntermedioRepresentación
Algoritmo para generar embeddings de palabras basado en su contexto. Introducido por Google en 2013. Incluye Skip-gram y CBOW.
Algoritmo de tokenización subword usado por BERT y otros modelos de Google. Similar a BPE pero basado en maximizar likelihood del corpus de entrenamiento. Permite manejar palabras raras dividiéndolas.
Word Sense Disambiguation
IntermedioTareas
Determinar el significado correcto de una palabra polisémica según su contexto (ej: "banco" financiero vs mueble).