Por favor, use este identificador para citar o enlazar este ítem: http://dspace.unach.edu.ec/handle/51000/6114
Título : “Análisis de exactitud de los algoritmos de clustering aplicados en la base de datos del sistema académico de la UNACH”
Autor : Lady Espinoza., Lady Espinoza.
Danny Daniel, Cáceres Lobato
Palabras clave : Clustering
K-Means
K- Medoids
Davies Bouldin
Fecha de publicación : 21-oct-2019
Editorial : Universidad Nacional de Chimnborazo
Citación : Facultad de Ciencias de Ingeniería
Resumen : La Universidad Nacional de Chimborazo (UNACH) dispone de varios sistemas informáticos uno de ellos es el Sistema de Control Académico (SICOA) mismo que contiene grandes cantidades de información académica, personal de estudiantes, docentes y producción científica, la cual se ha utilizado de forma limitada para la toma de decisiones en los procesos institucionales. En el presente trabajo se hace uso de la información que contiene el sistema de control académico de la UNACH, correspondientes a información académica, personal de estudiantes, docentes y producción científica. El trabajo consistió en el análisis de exactitud de los algoritmos de clustering K-Means y K-Medoids de aprendizaje no supervisado aplicados a la información indicada, el proceso de minería se llevó a cabo por medio de la metodología CRISP-DM misma que permitió analiza, limpiar y construir los datos, adicionalmente, el proceso de exactitud fue evaluado por nueve modelos tres por cada tabla: estudiante, docente e investigación en cada uno de los modelos se utilizó la métrica del índice de validación de Davies Bouldin. Como resultado se identificó que el algoritmo con mayor exactitud es K-Means, a través de este se generaron clústers de datos con característica similares y disimiles entre sí, estudiantes, docentes y producción científica. Los resultados obtenidos contribuirán al proyecto “Diseño de estrategias de mejoramiento continuo en la gestión académica e investigativa de la UNACH, utilizando minería de datos”.
Descripción : The Universidad Nacional de Chimborazo (UNACH) has several computer systems, one of them is the Academic Control System, known in Spanish as “SICOA” or “ACS” in English. It contains large amounts of academic information, student staff, professors and scientific production, which has been used in a limited way for making decision in institutional processes. In this paper, the information contained in the UNACH Academic Control System, corresponding to academic information, student staff, professors and scientific production, is used. The work was about the accuracy analysis of the K-Means and K-Medoids clustering algorithms of unsupervised learning applied to the indicated information, the mining process was carried out by means of the CRISP-DM methodology, this methodology allowed analyzing, cleaning and constructing the data. In addition, the accuracy process was evaluated by nine three models for each table: student, professors and research in each of the models the Davies Bouldin validation index metric was used. As a result, it was identified that the algorithm with greater accuracy is K-Means, through this, data clusters with similar and dissimilar characteristics, students, professors and scientific production were generated. The results obtained will contribute to the project “Designing strategies for continuous improvement in the academic and research management of UNACH, using data mining”.
URI : http://dspace.unach.edu.ec/handle/51000/6114
ISSN : ING-SIST-COMP
Aparece en las colecciones: Tesis - Ingeniería en Sistemas y Computación

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
Tesis_D_Cáceres_Clustering.pdf1,87 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons