Por favor, use este identificador para citar o enlazar este ítem: http://www.dspace.uce.edu.ec/handle/25000/17569
Título : Tecnología del lenguaje humano, modelado del lenguaje n-gramas al dominio ecuatoriano
Autor : Herrera Flores, Boris Enrique
Robinson Casierra, Ray Ricardo
Palabras clave : ALGORITMOS SUPERVISADOS
TWITTER
MINERÍA DE OPINIÓN
METODOLOGÍA CRISP-DM
Fecha de publicación : 2019
Editorial : Quito: UCE
Citación : Robinson Casierra, Ray Ricardo (2019). Tecnología del lenguaje humano, modelado del lenguaje n-gramas al dominio ecuatoriano. Trabajo de titulación previo a la obtención del Título de Ingeniero Informático. Carrera de Ingeniería Informática. Quito: UCE. 138 p.
Resumen : El presente proyecto tiene como objetivo analizar el comportamiento de los sentimientos implementando algoritmos supervisados, y n-gramas (un-grama, bi-gramas, tri-gramas), comparando el análisis de sentimientos entre datos obtenidos mediante la red social Twitter, y datos obtenidos mediante una encuesta realizada en la Facultad de Ingeniería Ciencias Físicas y Matemáticas, de la Universidad Central del Ecuador. Posteriormente, se extrae los tweets de la cuenta de la Universidad Central, para someterlos a limpieza de texto y que estén listos para el análisis mediante minería de opinión. Para determinar la polaridad de los tweets se hizo una comparación de algoritmos supervisados, de los cuales se optó el mejor Random Forest, tanto para los tweets y la encuesta utilizando R. El sistema aborda resultados para definir el nivel de aceptación en los tweets y de la encuesta que presenta la cuenta, los mismos que pueden ser visualizados gráficamente mediante la librería Shiny que permite realizar aplicaciones web. El proyecto emplea la metodología CRISP-DM para proyectos de minería de datos y R como lenguaje de programación que tiene un enfoque estadístico y es pertinente para este campo de estudio.
The present Project aims to analyze the behavior of the feelings implementing supervised algorithms andn-grams (one-grama, bi-grama, tri-grama), comparingthe feeling analysis between the data obtained from the Twitter social network and the data obtained through a survey carried out in the Faculty of Engineering, Physical Sciences and Mathematics of the Central University of Ecuador. Later, the tweets of the Central University account are extracted, to be submitted to text cleaning and to be ready for an analysis through a mining opinion. To determine the polarity of the tweets, a comparison of the supervised algorithms was performed, of which the best, Random Forests, was chosen both for the tweets and the survey, using R. The system approaches results to define the acceptance level in the tweets and of the survey that the account presents, which can be visualized graphically through the Shiny library that allows to perform web applications. The Project uses the CRISP-DM methodology for projects of data mining and R as programming language, which has a statistical approach and is relevant for this study field
URI : http://www.dspace.uce.edu.ec/handle/25000/17569
Aparece en las colecciones: Titulación - Ingeniería en Informática

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
T-UCE-0011-ICF-092.pdfTRABAJO DE TITULACIÓN A TEXTO COMPLETO2.69 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.