Tesis doctoral
Título | Methods for Self-Healing based on traces and unsupervised learning in Self-Organizing Networks |
Estado | Finalizado |
Autor | Ana Gómez Andrades |
Director/es | Raquel Barco Moreno |
Universidad | Universidad de Málaga |
Centro | Escuela Técnica Superior de Ingeniería de Telecomunicación |
Departamento | Ingeniería de Comunicaciones |
Fecha lectura | 19-07-2016 |
Con la llegada de las redes LTE y la proliferación de una gran variedad de servicios, los
operadores de telefonía móvil son cada vez más conscientes de la necesidad de reforzar las tareas
de operación y mantenimiento con el fin de garantizar una experiencia de usuario de calidad.
Además, la coexistencia de múltiples tecnologías de acceso radio (Radio Access Technologies,
RAT), el aumento de la demanda de tráfico y la necesidad de proporcionan una gran variedad
de servicios están dirigiendo las redes móviles hacia un escenario en el que las tareas de mantenimiento
son cada vez más complejas. Debido a ello, los operadores de telefonía móvil están
concentrando sus esfuerzos para abordar la gestión de la red sin aumentar los gastos operativos
ni los gastos de capital. En este contexto, se hace necesario automatizar de manera eficiente las
tareas de gestión a través de las redes auto-organizativas (Self-Organizing Networks, SON).
En concreto, las funciones SON cubren tres áreas: auto-configuración, auto-optimización y
auto-curación. La primera de ellas, auto-configuración, automatiza el despliegue de los nuevos
elementos de red así como la configuración de sus parámetros. La segunda, auto-optimización,
está encargada de modificar la configuración de los parámetros con el fin de mejorar la experiencia
del usuario. Finalmente, el sistema de auto-curación tiene como objetivo reducir el impacto que
los fallos y la degradación de los servicios tienen en el usuario final. Para ello, un sistema de
auto-curación monitorea los elementos de la red a través de alarmas, medidas e indicadores con
el fin de detectar cortes del servicio o celdas degradadas, posteriormente, diagnosticar la causa
de dichos fallos y, finalmente, ejecutar las acciones correctoras o compensadoras.
A pesar de que las redes móviles son cada vez más proclives a los fallos, debido al enorme
incremento de su complejidad, la automatización de las tareas de resolución de problemas a través
de la funcionalidad de auto-curación no se ha realizado completamente. Tradicionalmente, tanto
la investigación como el desarrollo de las redes SON ha estado relacionada con las funcionalidades
de auto-configuración y auto-optimización. Esto se ha debido principalmente a los desafíos que
hay que afrontar cuando se quiere estudiar e implementar un sistema de auto-curación. Esto
es especialmente relevante en el caso de la diagnosis de fallos. Sin embargo, los operadores de
telefonía móviles están prestando cada vez más atención a los sistemas de auto-curación, lo que
implica proponer opciones para hacer frente a dichos desafíos que permitan el desarrollo de las
funcionalidades de auto-curación.
Por un lado, actualmente, la diagnosis sigue siendo una tarea realizada manualmente dado
que requiere una considerable experiencia, obtenida con una dura labor, con el fin de ser capaz
de identificar la causa del fallo. En concreto, los expertos en resolución de problemas analizan
exhaustivamente el rendimiento de los elementos de red degradados con el fin de identificar la
causa de las anomalías detectadas. Por lo tanto, automatizar las tareas de diagnosis implica
conocer los indicadores que tienen que ser analizados y cómo mapear los síntomas identificados
con las causas de los fallos. Este conocimiento es adquirido a lo largo del tiempo y se caracteriza
por ser específico para cada operador en base a sus estrategias y las características de la red.
Además, los expertos típicamente resuelven los problemas sin documentar el proceso ni guardar
los indicadores analizados junto con la etiqueta de la causa del fallo. Debido a que no hay
una regulación específica sobre cómo documentarlo, los pocos fallos documentados no están bien
definidos ni descritos de manera estándar, lo que da lugar a que un mismo fallo sea nombrado con
distinta etiqueta, dificultando aún más el proceso de automatizar la extracción del conocimiento
experto. Como resultado, esta falta de documentación y de un histórico de casos etiquetados
hace que la automatización del proceso de diagnosis sea aún más difícil.
Por otro lado, cuando la causa exacta no puede ser identificada remotamente por medio de
los estadísticos recogidos a nivel de celda, los drive test son planificados para obtener información
más detallada. Mediante los drive test se toman medidas radio de la red móvil a lo largo de rutas
previamente definidas. En concreto, los expertos utilizan equipos de prueba especializados para
recoger medidas manualmente. Como consecuencia, los drive test suponen un alto coste para
los operadores, dado que conllevan una inversión considerable en tiempo y recursos (tales como
personal, vehículos y equipos de prueba). En este contexto, el Third Generation Partnership
Project (3GPP) ha estandarizado la recogida automática de medidas de campo (por ejemplo,
mensajes de señalización, medidas radio e información de localización) a través de la funcionalidad
de las trazas móviles y su funcionalidad extendida Minimization of Drive Tests (MDT). En
concreto, las trazas móviles están consideraras como un factor importante para mejorar las
funcionalidades SON dado que evitan a los operadores tener que depender de los caros drive test
mientras que al mismo tiempo proporciona muchos más detalles que los tradicionales indicadores
a nivel de celda. Como resultado, mejorar las funcionalidades de auto-curación a través de las
trazas móviles aumenta el ahorro en los costes y mejora la granularidad del análisis.
Por tanto, en esta tesis, distintas soluciones son propuestas para abordar los desafíos que evitan
el desarrollo de los sistemas de auto-curación con especial énfasis en la fase de diagnosis. Para
ello, la falta de casos etiquetados ha sido abordada de dos maneras distintas. En el primero se han
utilizado técnicas no supervisadas para diseñar automáticamente sistemas de diagnosis a partir
de datos reales sin necesitar ni datos etiquetados ni documentación sobre el comportamiento
de los fallos. En el segundo se ha modelado e implementado un grupo de fallos significativos
en un simulador dinámico con el fin de generar un conjunto de datos etiquetados que es sumamente
importante para evaluar y comparar las soluciones propuestas con algoritmos disponibles
en el estado del arte. Posteriormente, la diagnosis de los fallos que no pueden ser analizados
mediantes estadísticos a nivel de celda ha sido automatizada mediante el análisis de las trazas
móviles para evitar los costosos drive test. En concreto, en esta tesis, las trazas móviles se han
utilizado para identificar automáticamente la causa de cada desconexión de usuario indeseada,
para geo-localizar problemas radio que afectan al rendimiento global de la celda y para identificar
el impacto que provoca un fallo dependiendo de si hay sistemas preexistentes (tales como
la tercera generación móvil, 3G). Finalmente, se han validado las técnicas propuestas utilizando
tanto datos reales como simulados analizando su rendimiento y comparándolo con técnicas de
referencia.
Volver