Periodismo y web semántica

retos y propuesta de un periodismo estructurado mediante las 5 Ws

Autores/as

  • Aingeru Genaut Autor/a

DOI:

https://doi.org/10.61283/r285fk77

Palabras clave:

web semántica, periodismo estructurado, 5 W, big data, procesamiento del lenguaje natural

Resumen

El Big Data y el Procesamiento del Lenguaje Natural abren nuevas vías de redacción, edición, clasificación, difusión y recuperación para los textos periodísticos. Sin embargo, el mundo académico le ha prestado aún una atención limitada frente a las aportaciones de otras áreas como la lingüística, la biblioteconomía y, obviamente, la informática. Sin embargo, el periodismo tiene mucho que ofrecer y que recibir de la web semántica. El presente trabajo presenta el estado de la cuestión más allá de las aportaciones del ámbito de la comunicación periodística, buscando elementos comunes entre ellas, para pasar después a exponer una forma de abordar el reto de estructurar la información periodística sin que esta resulte disruptiva o rompa con la tradición académica ni con la profesión –desde la teoría del discurso a los libros de estilo y la redacción–. Se propone acercar la web semántica a la práctica periodística utilizando las cinco Ws del periodismo como criterios de identificación y clasificación del contenido. Al utilizar las Ws del periodismo –Qué, Quién, Dónde, Cuándo, Cómo y Por Qué– como criterios de identificación y clasificación, el contenido quedaría organizado en torno a su significado –a su función semántica–, aprovechando las especificidades de la estructura narrativa de la noticia.

Referencias

Agerri, R.; Artola, X.; Beloki, Z.; Rigau, G.; Soroa, A. (2015). Big data for Natural Language Processing: A streaming approach. Knowledge-Based Systems, 79, 36-42. http://dx.doi.org/10.1016/j.knosys.2014.11.007

Alvite, M.L. (2012). El uso de vocabularios controlados en los sistemas de información jurídica: evolución y tendencias actuales de representación. Scire. Representación y Organización del Conocimiento, 18(1): 29-39.

https://www.ibersid.eu/ojs/index.php/scire/article/view/3973

Arakaki, F.; Coneglian, C.; Santos, P.; Santarém, J. (2019). Disponibilidad de metadatos en linked data para repositorios digitales. Anales de Documentación, 22(2). http://dx.doi.org/10.6018/analesdoc.32744

Barba, C.; García-Nieto, J.; Navas-Delgado, I.; Aldana-Montes, J.F. (2016). A fine grain sentiment analisis with semantics in Tweets. International Journal of Interactive Multimedia and Artificial Intelligence, 3(6): 22-28.

http://dx.doi.org/10.9781/ijimai.2016.363

Baviera, T. (2017). Técnicas para el análisis de sentimiento en Twitter: Aprendizaje automático supervisado y SentiStrengh. Dígitos, 3: 33-50. http://dx.doi.org/10.7203/rd.v1i3.74

Beltrán, P. (2015). La documentación informativa y la recuperación de la información escrita. Nuevas competencias para el ciberespacio. Index.comunicación, 5(3): 29-57. http://hdl.handle.net/10115/15458

Berners-Lee, T. (2000). Tejiendo la red. Siglo XXI.

Berners-Lee, T.; Hendler J., y Lassila, O. (2001). The semantic web. Scientific American, mayo 2001, 29-37. https://www-sop.inria.fr/acacia/cours/essi2006/scientific%20american_%20feature%20article_%20the%20semantic%20web_%20may%202001.pdf

Bueno, M.R. (2000). Estructura textual, macroestructura semántica y superestructura formal de la noticia. Estudios sobre el Mensaje Periodístico, 6: 239-258. https://revistas.ucm.es/index.php/ESMP/article/download/ESMP0000110239A/0/0

Casas, J.; Nin, J; Julbe, F. (2019). Big Data: Análisis de datos en entornos masivos. UOC.

Casasús, J.M.; Núñez Ladevéze, L. (1991) Estilo y géneros periodísticos. Ariel.

Codina, L. (2016). Tres dimensiones del periodismo computacional. Intersecciones con las ciencias de la documentación. Anuario ThinkEPI, 10: 200-202. http://dx.doi.org/10.3145/thinkepi.2016.41

Colle, R. (2013). Prensa y ‘Big Data’: El desafío de la acumulación y análisis de datos. Revista Mediterránea de Comunicación, 4 (1): 1-8. https://doi.org/10.14198/MEDCOM2013.4.1.13

Conroy, N.; Rubin, V.; Chen, Y. (2016). Automatic deception detection: Methods for finding fake news. Proceedings of the Association for Information Science and Technology, 52(1): 1-4. https://doi.org/10.1002/pra2.2015.145052010082

Córdoba-Cabús, A; Hidalgo-Arjona, M; López-Martín, Á. (2021). Cobertura de diarios en Twitter de las elecciones autonómicas de Madrid 2021. Procesamiento de lenguaje natural y algoritmos de aprendizaje automático. Profesional de la Información, 30 (6). https://doi.org/10.3145/epi.2021.nov.11

Criado, J.I.; Villodre, J. (2018). Comunicando datos masivos del sector público local en redes sociales. Análisis de sentimiento en Twitter. El Profesional de la Información, 27(3): 614-623. https://doi.org/10.3145/epi.2018.may.14

Dovifat, E. (1960). Periodismo. Vols. 1 y 2. Uthera.

Drndarevic, B.; Saggion, H. (2012). Reducing text complexity through automatic lexical simplification: an empirical study for spanish. Procesamiento del Lenguaje Natural, 49: 13-20.

http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/4555

Fermoso-García, A.; Manzano-García, M.I.; Mateos-Sánchez, M.; Hernández, C. (2018). Sistema de modelado semántico para la catalogación, clasificación, consulta y publicación en abierto de información bibliográfica. El Profesional de la Información, 27(2): 410-418. https://doi.org/10.3145/epi.2018.mar.20

Fontuberta, M. de (2003) La noticia. Pistas para percibir el mundo. Paidós.

Freixa, P; Pérez-Montoro, M.; Codina. L. (2017). Interacción y divulgación de datos en el periodismo estructurado. El Profesional de la Información, 26(6): 1076-1090. https://doi.org/10.3145/epi.2017.nov.07

García, A. (2004). Instrumentos de representación del conocimiento: tesauros versus ontologías. Anales de Documentación, 7: 79-95. https://revistas.um.es/analesdoc/article/view/1691

García, A. (2014). Análisis documental de noticias de prensa en sistemas de información factual. Revista Española de Documentación Científica, 37(2):e046. http://dx.doi.org/10.3989/redc.2014.2.1094

García, A. (2016). Organización del conocimiento para la documentación en periodismo. Situación y prospectiva. Scire. Representación y Organización del Conocimiento, 22(2): 21-28. https://dialnet.unirioja.es/servlet/articulo?codigo=5713295

García, A.; Rodríguez, D.; Catalina, B. (2019). Estudio sobre la indización/etiquetado y los lenguajes documentales en cinco diarios españoles. Scire. Representación y Organización del Conocimiento, 25(1): 55-64.

https://ojs.ibersid.eu/index.php/scire/article/view/4579

Gomis, S. (2015). Publicar datos abiertos enlazados (LOD) en entornos bibliotecarios mediante el gestor de contenidos semántico Ximdex. Cuadernos de Gestión de Información, 5(1): 1-17. https://revistas.um.es/gesinfo/article/view/232181

González-Arias, C.; López-García, X. (2023). ChatGPT: Stream of opinion in five newspapers in the first 100 days since its launch. Profesional De La información, 32(5). https://doi.org/10.3145/epi.2023.sep.24

Grijelmo, A. (1997). El estilo del periodista. Taurus.

Gutiérrez-Caneda, B; Vázquez-Herrero, J.; López-García, X. (2023). AI application in journalism: ChatGPT and the uses and risks of an emergent technology. Profesional De La información, 32(5). https://doi.org/10.3145/epi.2023.sep.14

Hernando, A. (2015). El discurso periodístico en el reportaje de prensa. Signa: Revista de la Asociación Española de Semiótica, 24: 375-392 http://www.cervantesvirtual.com/descargapdf/el-discurso-periodistico-en-el-reportaje-de-prensa/

Lloret, E.; Palomar, M. (2011). COMPENDIUM: Una herramienta de generación de resúmenes modular. Procesamiento de Lenguaje Natural, 47:107-115. http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/955

Marcos, J.C.; Edo, C. (2015). Análisis de la nueva perspectiva de la documentación periodística en los medios de comunicación españoles. Revista General de Información y Documentación, 25(2): 389-423.

http://dx.doi.org/10.5209/rev_RGID.2015.v25.n2.51235

Martín, G. (1987). Géneros periodísticos. Paraninfo.

Martínez Albertos, J.L. (1991). Curso general de redacción periodística. Paraninfo.

Martínez, M.M.; Alvite, M.L. (2014). Propuesta metodológica de evaluación de gestores de tesauros compatibles con la web semántica. Anales de Documentación, 17(1): 1-18. https://doi.org/10.6018/analesdoc.17.1.186271

Mas, L. (2016a). Estructura formal, textual y oral del discurso público. Estudios sobre el Mensaje Periodístico, 22(1): 445-461. https://doi.org/10.5209/rev_esmp.2016.v22.n1.52606

Mas, L. (2016b) Caracterización prosódica del inicio, desarrollo y final de la noticia. Revista Española de Lingüística Aplicada, 29(1): 212-237. DOI: https://doi.org/10.1075/resla.29.1.09mas

Mateo, P.L.; González, J.C.; Villena, J.; Martínez, J.L. (2003). Un sistema para resumen automático de textos en castellano. Procesamiento del Lenguaje Natural, 31: 29-36. http://hdl.handle.net/10045/1486

Mungra, P.; Calziani, T. (2013). Lexicographic studies in medicine: Academic World List for clinical case histories. Ibérica: Revista de la Asociación Europea de Lenguas para Fines Específicos (AELFE), 25: 39-62.

https://dialnet.unirioja.es/servlet/articulo?codigo=4276659

Parratt, S. (2017). Manual práctico de redacción periodística. Síntesis.

Passos, A.; Kumar, V.; McCallum, A. (2014). Lexicon Infused Phrase Embeddings for Named Entity Resolution. Association for Computational Linguistics: 78-86. https://doi.org/10.3115/v1/W14-1609

Pedraza, R.; Codina, L.; Rovira, C. (2007). Web semántica y ontologías en el procesamiento de la información documental. El Profesional de la Información, 16(6): 569-579. https://doi.org/10.3145/epi.2007.nov.04

Pérez, A.; Casillas, A.; Gojenola, K.; Oroz, M.; Aguirre, N.; Amillano, E. (2014). The aid of machine learning to overcome the classification of real health discharge reports written in Spanish. Procesamiento del Lenguaje Natural, 53: 77-84. http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/5048

Pérez, M.A.; Cardoso, A.C. (2014). Técnicas de extracción de entidades con nombre. Inteligencia artificial, 17(53): 3-12. https://www.redalyc.org/pdf/925/92530455002.pdf

Pérez-Rosas, V.; Kleinberg, B.; Mihalcena, R. (2018). Automatic Detection of Fake News. Proceedings of the 27th International Conference on Computational Linguistics, 3391-3401. https://www.aclweb.org/anthology/C18-1287.pdf

Plaza, L.; Díaz, A. (2011). Using semantic graphs and word sense disambiguation techniques to improve text summarization. Procesamiento del Lenguaje Natural, 47: 97-105.

http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/956

Quesada, M. (2007). Periodismo de sucesos. Síntesis.

Ratinov, L.; Roth, D. (2009). Design Challenges and Misconceptions in Named Entity Recognition. Association for Computational Linguistics. Proceedings of the Thirteenth Conference on Computational Natural Language Learning (CoNLL-2009): 147-155. https://www.aclweb.org/anthology/W09-1119.pdf

Rodríguez, L. (2019). Desinformación: retos profesionales para el sector de la comunicación. El Profesional de la Información, 28(3). https://doi.org/10.3145/epi.2019.may.06

Rodríguez, T. (2013). Perspectivas en el análisis de la relación entre gramática y discurso: estructura periférica y conexiones entre oraciones. Círculo de Lingüística Aplicada a la Comunicación, 55, 3. https://doi.org/10.5209/rev_clac.2013.v55.43263

Sánchez, R.; Gil, B. (2007). Lenguajes documentales y ontologías. El Profesional de la Información, 16(6): 551-560. https://doi.org/10.3145/epi.2007.nov.02

Sancho, A.; Fernández, C.; Boulat, P. (2012). La búsqueda de información jurídica: de los tesauros a la inteligencia artificial.

Scire: Representación y Organización del Conocimiento, 18(1): 73-83. https://www.ibersid.eu/ojs/index.php/scire/article

/view/3942

Szostak, R. (2014). Advances in Classification Research Online 2013. Classification, Ontology, and the Semantic Web. Advances In Classification Research Online, 24(1): 30-37. http://dx.doi.org/10.7152/acro.v24i1.14674

Túñez-López, M.; Toural-Bran, C.; Cacheiro-Requieijo, S. (2018). Uso de bots y algoritmos para automatizar la redacción de noticias: percepción y actitudes de los periodistas en España. El Profesional de la Información, 27(4): 750-758. https://doi.org/10.3145/epi.2018.jul.04

Túñez-López, M.; Toural-Bran, C.; Valdiviezo-Abad, C. (2019). Automatización, bots y algoritmos en la redacción de noticias. Impacto y calidad del periodismo artificial. Revista Latina de Comunicación Social, 74(12): 1411-1433.

http://dx.doi.org/10.4185/RLCS-2018-1391

Ufarte, M.J.; Peralta, L.; Murcia-Verdú, F.J. (2018). Fact checking: un nuevo desafío del periodismo. El Profesional de la Información, 27(4): 733-741

Van Dijk, T. (1980). Texto y contexto. Cátedra.

Van Dijk, T. (1990). La noticia como discurso. Comprensión, estructura y producción de la información. Paidós.

Vera, A. (2012). El párrafo como unidad discursiva. Estudios de lingüística, 26: 343-358. http://hdl.handle.net/10045/28733

Warren, C. (1975). Géneros periodísticos informativos. ATE.

Descargas

Publicado

2024-07-06

Número

Sección

Articulos

Cómo citar

Genaut, A. (2024). Periodismo y web semántica: retos y propuesta de un periodismo estructurado mediante las 5 Ws. Revista Internacional De Investigación Y Transferencia En Comunicación Y Ciencias Sociales, 3(1), 14-31. https://doi.org/10.61283/r285fk77

Artículos similares

1-10 de 18

También puede Iniciar una búsqueda de similitud avanzada para este artículo.