Extracción de entidades con nombre

  • M. Alicia Pérez Facultad de Ingeniería e Informática e IESIING, Universidad Católica de Salta.
Palabras clave: minería de datos

Resumen

El uso de la minería de textos está aumentando en la actualidad ya que las organizaciones quieren aprovechar el potencial de la gran cantidad de información de que disponen en forma de documentos de texto u otra información no estructurada; este tipo de datos  supone  un  porcentaje considerable de los datos con que cuentan las organizaciones. Una de  las tareas  integrales  para la minería de textos es la extracción de entidades con nombre (NER). El presente trabajo describe los principales enfoques en uso para esta tarea, centrándose especialmente en los específicos para el aprendizaje de  secuencias.  Estas  técnicas  se  aplican a  un  problema  concreto, la extracción de información de un corpus de 8000 documentos correspondientes a resoluciones rectorales, de los que se extraen nombres de personas, diversos departamentos académicos y otras organizaciones vinculadas a la universidad. El  trabajo  describe  la arquitectura para la gestión de información no estructurada en la que se enmarca esta tarea y de la que forma parte, en la que las entidades extraídas permiten la búsqueda semántica de información. Los experimentos muestran que los campos aleatorios condicionales (CRFs) son la técnica más adecuada para el problema de extracción de entidades con nombre.

Descargas

La descarga de datos todavía no está disponible.

Biografía del autor/a

M. Alicia Pérez, Facultad de Ingeniería e Informática e IESIING, Universidad Católica de Salta.

Licenciada en Informática por la Universidad Politécnica de Madrid y PhD in Computer Science por Carnegie Mellon University. Actualmente se desempeña en la Facultad de ingeniería e Informática de UCASAL como docente de Sistemas Expertos y de Compiladores. También es profesora de la Maestría de Inteligencia de Negocios de la Universidad Cató- lica Boliviana Sede La Paz.

Publicado
2019-09-20
Cómo citar
Pérez, M. A. (2019). Extracción de entidades con nombre. Cuadernos De Ingeniería, (7), 51-71. Recuperado a partir de http://revistas.ucasal.edu.ar/index.php/CI/article/view/158
Sección
Artículos