Ciencia de redes · Guía conceptual
Glosario de redes complejas
Definiciones operativas para estudiar sistemas relacionales: desde teoría de grafos y métricas
estructurales hasta comunidades, procesos dinámicos, inferencia y machine learning sobre grafos.
Teoría de grafos
Python · NetworkX
Recursos interactivos
Lecturas
Fundamentos
Red compleja
Una red compleja representa un sistema mediante entidades y relaciones. Su valor analítico aparece
cuando la estructura de conexión no es trivial: heterogeneidad de grados, clustering, comunidades,
caminos cortos, dependencia entre observaciones y dinámica sobre la topología.
Representación
Nodos y aristas
Los nodos son las unidades del sistema; las aristas son las relaciones observadas o inferidas entre
ellas. La decisión crítica no es técnica sino conceptual: qué cuenta como entidad, qué cuenta como
relación, con qué dirección, peso, ventana temporal y nivel de agregación.
Métricas
Grado y fuerza
El grado cuenta cuántas conexiones tiene un nodo. En redes ponderadas, la fuerza suma los pesos de
esas conexiones. Ambas métricas son simples, interpretables y útiles como primera señal, pero pueden
ocultar redundancia, sesgo por actividad o diferencias de posición estructural.
Topología
Centralidad
Centralidad no significa una sola cosa. Degree centrality mide actividad local; betweenness mide
intermediación en caminos; closeness captura cercanía global; eigenvector y PageRank ponderan la
importancia de los vecinos. La métrica correcta depende de la pregunta y del proceso que se modela.
Topología
Clustering y transitividad
El clustering mide hasta qué punto los vecinos de un nodo también están conectados entre sí.
La transitividad resume ese patrón a escala global. En redes sociales suele interpretarse como
cierre triádico; en datos proyectados puede aparecer artificialmente por nodos de alta actividad.
Modelos
Mundo pequeño
Una red de mundo pequeño combina caminos promedio cortos con alto clustering. El modelo
Watts-Strogatz muestra cómo pocos enlaces de largo alcance pueden reducir distancias sin destruir
completamente la estructura local, un mecanismo clave para difusión y búsqueda en redes.
Modelos
Red libre de escala y preferential attachment
Las redes libres de escala presentan distribuciones de grado con cola pesada: pocos nodos concentran
muchas conexiones y muchos nodos tienen baja conectividad. Preferential attachment es un mecanismo
generativo donde los nodos con más enlaces tienden a recibir nuevos enlaces con mayor probabilidad.
Estructura
Homofilia y assortativity
La homofilia describe la tendencia de nodos similares a conectarse. La assortativity cuantifica mezcla
por atributos o por grado. Ambos conceptos ayudan a separar patrones sustantivos de sesgos de observación
y son críticos al interpretar comunidades, desigualdad y segmentación.
Topología
Laplaciano y análisis espectral
El Laplaciano de un grafo conecta estructura, difusión y particionamiento. Sus eigenvalores entregan
información sobre conectividad, cortes, estabilidad y dinámica. Es una herramienta conceptual clave
para entender clustering espectral, procesos de difusión y algunos fundamentos de Graph ML.
Recurso interactivo
Red bipartita
Una red bipartita conecta dos tipos de nodos, como empresas y organismos, autores y papers, o usuarios
y productos. Es una representación natural para sistemas de afiliación. Proyectarla a una sola capa
puede ser útil, pero también infla enlaces y clustering si no se controla la actividad.
Inferencia
Modelos nulos
Un modelo nulo define qué estructura esperaríamos por azar bajo restricciones específicas, por ejemplo
preservando tamaño, densidad o secuencia de grados. Sin modelos nulos, muchas conclusiones sobre
clustering, centralidad o comunidades pueden ser solo artefactos de la distribución de actividad.
Recurso interactivo
Comunidades y modularidad
Una comunidad es un conjunto de nodos más densamente conectado internamente que con el resto de la red.
La modularidad formaliza esa comparación contra un baseline. Algoritmos como Louvain y Leiden son
útiles, pero requieren revisar resolución, estabilidad y significado sustantivo de los grupos.
Mesoestructura
Core-periphery y k-core
Core-periphery describe redes con un núcleo densamente conectado y una periferia menos integrada.
k-core identifica subgrafos donde cada nodo mantiene al menos k conexiones internas. Ambos enfoques
ayudan a distinguir nodos estructuralmente robustos de nodos simplemente activos.
Recurso interactivo
Difusión y contagio en redes
Los procesos de difusión conectan estructura y dinámica. En modelos SIR/SIS, la probabilidad de
propagación depende de contactos, recuperación, posición en la red y heterogeneidad de grados. El nodo
más central para informar no siempre es el más importante para contener un contagio.
Dinámica
Red temporal
Una red temporal conserva cuándo ocurren las interacciones. Es distinta de una red agregada, que colapsa
todos los contactos en una sola estructura. Para difusión, riesgo, recomendación o fraude, el orden de los
enlaces puede cambiar completamente qué caminos son posibles.
Evaluación
Inferencia en redes
Los datos de red no son independientes: las observaciones comparten vecinos, comunidades, historia y
mecanismos de formación. Por eso la evaluación debe cuidar leakage, splits temporales o estructurales,
modelos nulos y reportes explícitos de límites, sesgos y supuestos.
Graph ML
Link prediction
Link prediction estima qué enlaces podrían aparecer, faltar o ser relevantes. Puede usar heurísticas
estructurales, embeddings o modelos supervisados. Su principal riesgo metodológico es el leakage:
entrenar con información futura o con particiones que destruyen la dependencia temporal de la red.
Graph ML
Heterofilia
La heterofilia aparece cuando nodos conectados tienden a tener etiquetas o atributos distintos. Rompe
el supuesto de suavidad local que muchos GNN explotan. En esos casos, agregar vecinos sin criterio puede
degradar desempeño y conviene usar arquitecturas, features o splits diseñados para esa estructura.
Graph ML
Graph Machine Learning
Graph ML usa la estructura relacional como señal predictiva. Incluye embeddings de nodos, clasificación
de nodos, predicción de enlaces y Graph Neural Networks. No siempre mejora sobre features de red bien
construidas; conviene usarlo cuando la dependencia estructural es parte real del fenómeno.
Graph ML
Oversmoothing
Oversmoothing es un problema de algunas GNN profundas: al propagar mensajes muchas veces, las
representaciones de nodos distintos se vuelven demasiado parecidas. El resultado puede ser menor
capacidad discriminativa, especialmente en grafos heterofílicos o con señales locales débiles.
Graph ML
Knowledge graph
Un knowledge graph organiza entidades y relaciones semánticas, a menudo con múltiples tipos de nodos y
enlaces. Se usa en búsqueda, recomendación, integración de datos y razonamiento. Su análisis combina
modelamiento relacional, embeddings, reglas de negocio y evaluación cuidadosa de enlaces faltantes.
¿Qué diferencia hay entre teoría de grafos y ciencia de redes?
La teoría de grafos provee el lenguaje matemático para describir nodos, aristas, caminos, conectividad
y estructuras. La ciencia de redes usa ese lenguaje para estudiar sistemas empíricos, sus mecanismos de
formación, sus patrones estadísticos y los procesos que ocurren sobre la red.
¿Por qué no basta con calcular centralidades?
Porque cada centralidad responde una pregunta distinta y puede estar dominada por sesgos de medición,
actividad o tamaño. En un análisis serio, las centralidades se interpretan junto con el objetivo del
problema, la calidad del dato, modelos nulos y análisis de sensibilidad.
¿Cuándo conviene usar Graph Neural Networks?
Conviene considerarlas cuando la dependencia entre nodos es predictiva, hay suficiente señal relacional
y la evaluación evita leakage. Para muchos problemas aplicados, un feature store con métricas de red,
buenos splits y modelos tabulares puede ser un baseline más transparente y competitivo.
¿Qué es un modelo nulo en redes y por qué importa?
Es un baseline estadístico que define qué estructura esperaríamos bajo ciertas restricciones. Importa
porque permite distinguir patrones reales de artefactos producidos por tamaño, densidad, secuencia de
grados, actividad de usuarios o mecanismos de muestreo.
¿Qué diferencia hay entre una red bipartita y una proyección?
La red bipartita conserva dos tipos de nodos y sus relaciones originales. La proyección transforma esa
información en una red de un solo tipo de nodo. La proyección puede facilitar análisis, pero también
puede inflar enlaces, clustering y centralidades si no se pondera o valida correctamente.
¿Por qué modularidad no es sinónimo de comunidades verdaderas?
Modularidad compara una partición contra un modelo nulo específico. Puede tener límites de resolución,
múltiples óptimos parecidos y sensibilidad a pesos o semillas. Por eso una partición debe evaluarse por
estabilidad, interpretación sustantiva y consistencia con la pregunta de investigación.
¿Por qué los splits aleatorios pueden ser malos en redes?
Porque los nodos y enlaces no son observaciones independientes. Un split aleatorio puede filtrar
información del futuro o de vecinos cercanos hacia el entrenamiento. En redes, la validación debe
respetar temporalidad, componentes, tareas de predicción y posibles mecanismos de leakage.
¿Cuál es la diferencia entre embeddings de nodos y GNN?
Los embeddings aprenden representaciones vectoriales de nodos a partir de patrones estructurales, como
caminatas aleatorias o co-ocurrencias. Las GNN aprenden representaciones mediante propagación de mensajes
y pueden incorporar atributos, etiquetas y objetivos supervisados de forma más directa.
¿Cómo aprender redes complejas con Python de forma rigurosa?
La ruta práctica es modelar bien nodos y enlaces, auditar datos, usar NetworkX o igraph para métricas,
comparar contra modelos nulos, documentar supuestos y validar conclusiones con sensibilidad. El código
debe acompañarse siempre de una pregunta sustantiva y no solo de métricas descriptivas.