Relaciones entre entidades nombradas en un texto noticioso
Palabras clave:
lingüística de corpus, entidades nombradas, corpus lingüísticos, ling¨üística computacionalResumen
El artículo se enfoca en el análisis de textos de noticias dentro de un corpus etiquetado, abordando temas diversos. Se presenta una clasificación de las relaciones semánticas entre las entidades nombradas en un texto etiquetado en
formato XML, junto con una descripción de las etiquetas utilizadas. El objetivo principal es desarrollar una solución para extraer relaciones entre entidades nombradas en noticias en español, basándose en el etiquetado gramatical, la detección de entidades y la resolución de correferencias. El método empleado consiste en el etiquetado gramatical y el análisis sintáctico, y abarca tanto entidades nombradas como relaciones gramaticales y semánticas. Esta propuesta puede considerarse útil para el desarrollo y evaluación de nuevos sistemas de extracción de información en español, concluyendo que los corpus, la lingüística de corpus y la lingüística computacional son herramientas valiosas en el proceso de enseñanza automática a las computadoras para comprender el lenguaje natural.
Citas
Alonso, L. (1998). El análisis sociológico de los discursos: una aproximación desde los usos concretos. Ed. Fundamentos.
Arredondo Toledo, L. M. (2018) Extracción de relaciones entre las entidades nombradas en el idioma español (Tesis presentada en opción al Título Académico de Máster en Ciencia de la Computación).
carmitada77, (4 julio, 2015) Análisis del Discurso. Métodos de investigación URL: https://metodosdeinvestigaciondcgunefa.wordpress.com/2015/07/04/analisis-del-discurso/
Bernal Chávez, Julio Alexánder y Diana Alejandra Hincapié Moreno (2018): Lingüística de corpus. URL: http://bibliotecadigital.caroycuervo.gov.co/1703/1/Linguistica-de-corpus-2018.pdf
Boillos Pereira, Mari Mar. (2018) La elaboración de un corpus del profesorado de español (copele): ¿utopía o realidad? URL: https://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-48832018000200153
Culotta, A., & Sorensen, J. (2004, July). Dependency tree kernels for relation extraction. In Proceedings of the 42nd annual meeting on association for computational linguistics (p. 423). Association for Computational Linguistics.
Culotta, A., McCallum, A., & Betz, J. (2006, June). Integrating probabilistic extraction models and data mining to discover relations and patterns in text. In Proceedings of the main conference on Human Language Technology Conference of the North American Chapter of the Association of Computational Linguistics (pp. 296-303). Association for Computational Linguistics.
Filología e informática (1999): nuevas tecnologías en los estudios filológicos (pp. 45-77). Milenio.
Jurafsky, D., & Martin, J. H. (2017) Vector Semantics. Speech and Language Processing: An Introduction to Natural Language Processing. Computational Linguistics, and Speech Recognition (3rd ed draft chapter 15-16).
Lyons, John. (1997): Semántica lingüística. Paidós.
Mar Cruz Piñol. Lingüística de corpus y enseñanza del español como 2/L. Madrid: Arco/Libros, 2017. pp 189. URL: https://www.arcomuralla.com/detalle_libro.php?id=872
Martín Peris, Ernesto. (coord.) (2008). Diccionario de términos clave de ELE. SGEL.
Mercado, H. (2008). Fundamentos de la lingüística de corpus.
Pardo Abril, Neyla Graciela (2002). El contexto y el discurso público. URL: https://revistas.udistrital.edu.co/index.php/enunc/article/view/2465/3432
Sinclair, J.M. (1991). Corpus, Concordance, Collocation. Oxford: Oxford University Press.
Torruela, J. & Llisterri, J. (1999a). Diseño de corpus textuales y orales. En Filología e informática: nuevas tecnologías en los estudios filológicos (pp. 45-77). Milenio.
Wallis, S. and Nelson G. 'Knowledge discovery in grammatically analysed corpora'. Data Mining and Knowledge Discovery, 5: 307–340.
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2023 Reynier Ávila Peña, Celia María Pérez Marqués, Yaney Bourzac Álvarez, Daymara López Cordero
Esta obra está bajo una Licencia Creative Commons Atribución 2.5 Argentina.
Los/as autores/as que publican en esta revista están de acuerdo con los siguientes términos:
1. Los/as autores conservan los derechos de autor y garantizan a la revista el derecho de ser la primera publicación del trabajo bajo una licecncia Creative Commons Atribución 2.5 Argentina (CC BY 2.5 AR) . Por esto pueden compartir el trabajo con la referencia explícita de la publicación original en esta revista.
2. Anales de lingüística permite y anima a los autores a difundir la publicación realizada electrónicamente, a través de su enlace y/o de la versión postprint del archivo descargado de forma independiente.
3. Usted es libre de:
Compartir — copiar y redistribuir el material en cualquier medio o formato
Adaptar — remezclar, transformar y construir a partir del material para cualquier propósito, incluso comercialmente.