Machine learning on complex networks: dynamical fingerprints, embeddings and feature...
Contenido de la obra
Contenido de la obra
Registro bibliográfico
Registro
- Título: Machine learning on complex networks: dynamical fingerprints, embeddings and feature engineering = Aprendizaje automático en redes complejas: huellas digitales dinámicas, embeedings e ingeniería de características
- Autor: Gutiérrez Gómez, Efraín Leonardo
- Publicación original: 2019
- Descripción física: PDF
-
Nota general:
- Colombia
- Notas de reproducción original: Digitalización realizada por la Biblioteca Virtual del Banco de la República (Colombia)
-
Notas:
- Resumen: Abstract: Complex networks emerge as a natural framework to describe real-life phenomena involving a group of entities and their interactions, i.e., a social net-work. Furthermore, other problems involve a collection of networks, such as multi-layer, temporal, or brain networks (connectomes). With the increasing availability of graph-shaped data and associated meta-data, i.e., node or edge attributes, machine learning (ML) techniques on networks have risen in popularity. However, there are still several challenging issues to be addressed concerning feature engineering, graph representation, visualization, and general graph mining applications. This thesis contributes to bridging the gap between ML and complex net-works. We investigate dynamics on networks such as discrete and continuous- time random walks, in two directions. First, we develop a multi-scale anomaly detection algorithm on attributed networks. We exploit the link between graph signal processing and the Markov stability framework used in community detection, for spotting anomalous nodes in multiple contexts of the network. Second, we introduce a generalization of assortativity on networks operating on scalar and categorical node attributes. These coefficients turn out to be useful descriptors to build network fingerprints, so that we can perform supervised graph classification, i.e., predicting the toxicity of molecules or classifying Reddit discussion threads. Besides, we develop an unsupervised approach to learn graph embeddings from a collection of networks. By learning a non-linear mapping from input graphs to a lower-dimensional feature space, we obtain useful graphs representations used in graph visualization, clustering, and classification, e.g., predicting people’s gender based on their structural connectome. Finally, we propose a principled approach to identify stable biomarkers for schizophrenia diagnosis in the human connectome. From an ML perspective, the problem is stated as an embedded feature selection scheme for graph classification. By doing so, we identify the affected-core in schizophrenia, highlighting increasing performance when structural and functional neural features are combined. Resumen: Las redes complejas emergen como marco general en la descripción de problemas reales que incluyen entidades y sus interacciones, ex., redes sociales. Además, otros problemas incluyen colecciones de redes tales como redes multi nivel, redes temporales o redes del cerebro. Con el incremento de la disponibilidad de datos en forma de grafos y metadatos asociados, ex., atributos en nodos o ejes, técnicas de aprendizaje automático en redes han incrementado en popularidad. Sin embargo, múltiples desafíos siguen aún sin ser resueltos, relacionados con representación de grafos, ingeniería de características en grafos, visualización y aplicaciones generales de minería de datos sobre grafos. Esta tesis doctoral contribuye a cerrar la brecha entre dos campos del conocimiento emergentes: aprendizaje automático y ciencia de redes. En esta tesis se investigan sistemas dinámicos sobre redes en la extracción de características estructurales en redes y se introduce una generalización de asortatividad en redes. Dicha asortatividad permite definir descriptores de grafos útiles en la construcción de huellas digitales de redes utilizadas en problemas de aprendizaje supervisado en clasificación de grafos, ex., predicción de toxicidad en moléculas o clasificación de redes sociales Reddit. Además, esta tesis propone un nuevo método no supervisado para crear embeedings de grafos. Gracias a la estimación de una función no lineal, se puede mapear grafos enteros en espacios euclideanos, preservando la similaridad entre grafos de origen. Finalmente, se propone un algoritmo para el diagnóstico de esquizofrenia en el cerebro humano usando connectomes, destacando las regiones del cerebro afectadas por la enfermedad mostrando resultados de alta confiabilidad utilizando distintas representaciones neuronales.
- © Derechos reservados del autor
- Colfuturo
- Forma/género: tesis
- Idioma: castellano
- Institución origen: Biblioteca Virtual del Banco de la República
-
Encabezamiento de materia: