Relations between Entities Named in News Texts
Keywords:
corpus linguistics, named entities, language corpora, computational linguisticsAbstract
The article focuses on the analysis of news texts within a tagged corpus, addressing various topics. It presents a classification of semantic relationships between named entities in the tagged text in XML format, along with a description of the used tags. The main objective is to develop a solution for extracting relationships
between named entities in Spanish news, based on grammatical tagging, entity detection, and coreference resolution. The method employed consisted of grammatical tagging and syntactic analysis, covering both named entities and the
grammatical and semantic relationships. This proposal is considered useful for the
development and evaluation of new information extraction systems in Spanish, concluding that corpora, corpus linguistics, and computational linguistics are valuable tools in the process of teaching computers automatic understanding of
natural language.
References
Alonso, L. (1998). El análisis sociológico de los discursos: una aproximación desde los usos concretos. Ed. Fundamentos.
Arredondo Toledo, L. M. (2018) Extracción de relaciones entre las entidades nombradas en el idioma español (Tesis presentada en opción al Título Académico de Máster en Ciencia de la Computación).
carmitada77, (4 julio, 2015) Análisis del Discurso. Métodos de investigación URL: https://metodosdeinvestigaciondcgunefa.wordpress.com/2015/07/04/analisis-del-discurso/
Bernal Chávez, Julio Alexánder y Diana Alejandra Hincapié Moreno (2018): Lingüística de corpus. URL: http://bibliotecadigital.caroycuervo.gov.co/1703/1/Linguistica-de-corpus-2018.pdf
Boillos Pereira, Mari Mar. (2018) La elaboración de un corpus del profesorado de español (copele): ¿utopía o realidad? URL: https://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-48832018000200153
Culotta, A., & Sorensen, J. (2004, July). Dependency tree kernels for relation extraction. In Proceedings of the 42nd annual meeting on association for computational linguistics (p. 423). Association for Computational Linguistics.
Culotta, A., McCallum, A., & Betz, J. (2006, June). Integrating probabilistic extraction models and data mining to discover relations and patterns in text. In Proceedings of the main conference on Human Language Technology Conference of the North American Chapter of the Association of Computational Linguistics (pp. 296-303). Association for Computational Linguistics.
Filología e informática (1999): nuevas tecnologías en los estudios filológicos (pp. 45-77). Milenio.
Jurafsky, D., & Martin, J. H. (2017) Vector Semantics. Speech and Language Processing: An Introduction to Natural Language Processing. Computational Linguistics, and Speech Recognition (3rd ed draft chapter 15-16).
Lyons, John. (1997): Semántica lingüística. Paidós.
Mar Cruz Piñol. Lingüística de corpus y enseñanza del español como 2/L. Madrid: Arco/Libros, 2017. pp 189. URL: https://www.arcomuralla.com/detalle_libro.php?id=872
Martín Peris, Ernesto. (coord.) (2008). Diccionario de términos clave de ELE. SGEL.
Mercado, H. (2008). Fundamentos de la lingüística de corpus.
Pardo Abril, Neyla Graciela (2002). El contexto y el discurso público. URL: https://revistas.udistrital.edu.co/index.php/enunc/article/view/2465/3432
Sinclair, J.M. (1991). Corpus, Concordance, Collocation. Oxford: Oxford University Press.
Torruela, J. & Llisterri, J. (1999a). Diseño de corpus textuales y orales. En Filología e informática: nuevas tecnologías en los estudios filológicos (pp. 45-77). Milenio.
Wallis, S. and Nelson G. 'Knowledge discovery in grammatically analysed corpora'. Data Mining and Knowledge Discovery, 5: 307–340.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2023 Reynier Ávila Peña, Celia María Pérez Marqués, Yaney Bourzac Álvarez, Daymara López Cordero
Esta obra está bajo una Licencia Creative Commons Atribución 2.5 Argentina.
Los/as autores/as que publican en esta revista están de acuerdo con los siguientes términos:
1. Los/as autores conservan los derechos de autor y garantizan a la revista el derecho de ser la primera publicación del trabajo bajo una licecncia Creative Commons Atribución 2.5 Argentina (CC BY 2.5 AR) . Por esto pueden compartir el trabajo con la referencia explícita de la publicación original en esta revista.
2. Anales de lingüística permite y anima a los autores a difundir la publicación realizada electrónicamente, a través de su enlace y/o de la versión postprint del archivo descargado de forma independiente.
3. Usted es libre de:
Compartir — copiar y redistribuir el material en cualquier medio o formato
Adaptar — remezclar, transformar y construir a partir del material para cualquier propósito, incluso comercialmente.