Por favor, use este identificador para citar o enlazar este ítem:
http://dspace.unach.edu.ec/handle/51000/15667
Título : | Análisis De Datos Masivos De Usuarios En Redes Sociales Mediante Técnicas De Segmentación De Usuarios Y Predicción De Comportamientos |
Autor : | Castro Cepeda, Lidia Del Rocío Barco Quiñonez, Juan Carlos |
Palabras clave : | aprendizaje automático comportamiento del usuario CRISP-DM minería de datos predicción |
Fecha de publicación : | 21-jul-2025 |
Editorial : | Riobamba: Universidad Nacional de Chimborazo |
Citación : | Barco, Juan C. (2025). Análisis De Datos Masivos De Usuarios En Redes Sociales Mediante Técnicas De Segmentación De Usuarios Y Predicción De Comportamientos. (Tesis de posgrado). Universidad Nacional de Chimborazo. Riobamba, Ecuador. |
Resumen : | El presente trabajo de investigación, titulado “Análisis de datos masivos de usuarios en redes sociales mediante técnicas de segmentación y predicción de comportamientos”, aborda la necesidad de comprender y anticipar patrones de interacción en plataformas digitales a partir del análisis de grandes volúmenes de datos. La investigación se centra en el desarrollo de un modelo basado en técnicas de segmentación y aprendizaje automático, con el fin de predecir el nivel de interacción de los usuarios en contenidos audiovisuales. Para alcanzar este objetivo, se empleó un conjunto de datos proveniente del repositorio Kaggle, específicamente el “YouTube Dislikes Dataset” del autor Dmitry Nikolaev. Este conjunto contiene métricas cuantitativas asociadas a videos publicados en YouTube, tales como el número de visualizaciones, me gusta, no me gusta, cantidad de comentarios y fecha de publicación. La metodología adoptada fue CRISP-DM (Cross Industry Standard Process for Data Mining), que estructuró el proceso en etapas como la comprensión de los datos, su preparación, la modelación utilizando algoritmos como Random Forest, y la evaluación de resultados. Adicionalmente, se aplicaron técnicas de ingeniería de características y balanceo de clases para optimizar el rendimiento del modelo predictivo. Los resultados obtenidos revelan que variables como el ratio de interacción y las vistas por día son determinantes en la clasificación de videos con alta participación. El modelo alcanzó una precisión superior al 96 %, lo que evidencia la eficacia del enfoque aplicado. En síntesis, este estudio demuestra que el uso de técnicas de aprendizaje automático sobre datos masivos extraídos de redes sociales permite no solo identificar patrones de comportamiento digital, sino también construir herramientas predictivas con aplicaciones prácticas en la toma de decisiones para plataformas de contenido y marketing digital. |
Descripción : | This thesis, titled “Analysis of Massive User Data on Social Media through Segmentation and Behavior Prediction Techniques”, addresses the need to understand and anticipate interaction patterns on digital platforms by analyzing large volumes of data. The research focuses on the development of a model based on segmentation techniques and machine learning to predict user engagement with audiovisual content. To achieve this objective, a dataset from the Kaggle repository, specifically the “YouTube Dislikes Dataset” by Dmitry Nikolaev, was utilized. This dataset contains quantitative metrics associated with YouTube videos, such as views, likes, dislikes, comment count, and publication date. The adopted methodology followed the CRISP-DM (Cross Industry Standard Process for Data Mining) framework, which structured the process into stages including data understanding, preparation, modeling (using algorithms like Random Forest), and result evaluation. Additionally, feature engineering and class balancing techniques were applied to optimize the predictive model's performance. The results show that variables such as the engagement ratio and views per day are key determinants in classifying videos with high engagement. The model achieved an accuracy exceeding 96%, demonstrating the effectiveness of the applied approach. In conclusion, this study shows that the use of machine learning techniques on massive social media data allows not only the identification of digital behavior patterns but also the development of predictive tools with practical applications for decision-making in content platforms and digital marketing. |
URI : | http://dspace.unach.edu.ec/handle/51000/15667 |
ISSN : | UNACH-DP-MAT-MC |
Aparece en las colecciones: | Magíster en matemática aplicada con mención en Matemática Computacional |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
Barco, Juan (2025) Análisis De Datos Masivos De Usuarios En Redes Sociales.pdf | 1,72 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.