Guía completa sobre gestión de incidentes (parte 1)

Guía completa sobre gestión de incidentes (parte 1)

La tecnología está en todas partes y dependemos de ella. Ya sean el hogar, el trabajo, la escuela, la salud o las necesidades cívicas, la tecnología está involucrada. Por tal motivo nos frustramos tanto ante cualquier interrupción del funcionamiento normal. Este post es el primero de dos partes sobre la gestión de incidentes donde analizamos qué es un incidente, en qué consiste la gestión de incidentes y algunos ejemplos.

Las redes sociales están inundadas de historias de sistemas que no funcionan como deberían: sistemas bancarios, portales de atención médica, reservas de aerolíneas, compras en línea e incluso las propias plataformas de redes sociales.

Por esta razón, la mayoría de las relaciones entre cualquier proveedor de servicios y sus clientes dependen en gran medida de si puede garantizar una interrupción mínima. Cuando ocurre la interrupción inevitable, debe gestionar el incidente de una manera que el consumidor haya aceptado tolerar. La gestión de incidentes es el nombre formal de esta práctica empresarial necesaria y no es algo que las empresas deban tomar a la ligera, sin importar su industria.

¿Qué es un incidente?

Cuando se trata de garantizar que los servicios operativos proporcionen valor a los clientes, la gestión de incidentes se encuentra entre las disciplinas más importantes. ITIL® 4 define un incidente como:

Una interrupción no planificada de un servicio o reducción en la calidad de un servicio.

Aquí hay algunas otras definiciones:

  • ISO 20000 define un incidente como una interrupción no planificada de un servicio, una reducción en la calidad de un servicio o un evento que aún no ha impactado el servicio al cliente o usuario.
  • VeriSM amplía el término ‘problema’ para cubrir situaciones en las que un cliente percibe una interrupción del servicio, así como interrupciones reales.

La forma en que un proveedor de servicios maneja los incidentes juega un papel muy importante a la hora de determinar la satisfacción del cliente. A continuación se muestran algunos ejemplos de una incidencia en un sistema en línea:

  • Los usuarios no pueden iniciar sesión
  • La falta de capacidad de respuesta del sistema a los comandos.
  • Lentitud percibida en comparación con lo normal.
  • Datos corruptos o pirateados

Por supuesto, no todos los incidentes son visibles para el usuario final. Pero todavía requieren su atención.

¿Qué es la gestión de incidentes?

El propósito de la práctica de gestión de incidentes es minimizar el impacto negativo de los incidentes restableciendo la operación normal del servicio lo más rápido posible.

Ya sea que se trate de una computadora portátil averiada, datos corruptos o una aplicación tremendamente lenta, la forma en que respondemos y manejamos la interrupción del servicio indica si tenemos un proceso óptimo de gestión de incidentes.

Esta práctica puede ser manejada por un individuo, equipos o múltiples organizaciones según la escala. Las organizaciones exitosas designan un Comandante de Incidentes (IC) específico, una persona que es responsable de liderar un equipo multifuncional temporal para concentrar todas las energías y atención hacia una resolución rápida.

La capacidad de su empresa para abordar rápidamente las incidencias es un factor clave para:

  • Satisfacción del usuario y del cliente
  • Su credibilidad y reputación
  • El valor que creas en tus relaciones.

Claramente, estas son áreas en las que debe sobresalir, haciendo de la gestión de incidentes una actividad crítica. En su forma más esencial, la gestión de incidentes implica dos actividades principales:

  1. Registro
  2. Administrar

Una vez que identifique el incidente o reciba una notificación sobre él, podrá capturar la información suficiente sobre él, incluida la descripción, la hora y la fuente. Este registro luego se convierte en la base para el análisis y las decisiones sobre la gestión del incidente, que incluyen:

  • Comunicación
  • Resolución
  • Escalada
  • Transferencia a otros procesos

Las actividades clásicas de gestión de incidentes descritas en ITIL 4 se ven a continuación:

La gestión exitosa de incidentes se basa en tener una comprensión clara de lo que el cliente acordó o está dispuesto a tolerar con respecto a la duración y el manejo de cualquier incidente en particular. Esto suele definirse en acuerdos de nivel de servicio (SLA) o contratos, que incluyen cronogramas para responder y resolver incidentes en función de algunos criterios, generalmente prioritarios, en función del impacto y la urgencia.

Como proveedor de servicios, la forma en que estructura su organización para manejar diferentes tipos de incidentes es un factor importante en la ejecución de la gestión de incidentes:

  • Algunos incidentes pueden ser repetibles y sus causas se conocen. En estos casos, puede definir y utilizar modelos de incidentes para su manejo y resolución. Un modelo de incidente es un enfoque repetible para gestionar un tipo particular de incidente. Los modelos ayudan a reducir tanto el tiempo de resolución como la curva de aprendizaje de los nuevos empleados.
  • Cuando no sea fácil encontrar una solución a un incidente, se puede aplicar una solución alternativa para intentar reducir el impacto y/o la probabilidad de que se repita. Las soluciones alternativas, como reinicios o reconfiguraciones, pueden restaurar rápidamente los servicios a un nivel de calidad aceptable.

(Es importante destacar que la gestión de incidentes es diferente de la gestión de problemas, que se centra en cómo se maneja el problema en el futuro).

Hay muchas partes móviles involucradas en la gestión de incidentes. Por lo tanto, es imperativo que aplique un enfoque riguroso en todas las actividades del proceso, asegurando que el valor del servicio y la percepción del cliente no se vean erosionados por un mal manejo o una mala coordinación. Ponte en contacto con nuestro equipo de especialistas en gestión de incidentes, que te ayudarán a evaluar las necesidades de tu negocio, a la par de la revisión y el análisis continuos de las actividades de gestión de incidentes que garantizarán que se mantenga progresivamente un enfoque rentable, que maximice las capacidades de tu negocio.

Consulta el texto original en inglés.

Desafíos de la gestión de activos tecnológicos y cómo superarlos

Un mal seguimiento y gestión de activos de TI, desde hardware y software o recursos virtuales pueden afectar la eficiencia operativa y riesgos

Enfoque AIOps para proveedores de servicios de comunicación

La inteligencia artificial para operaciones de TI – AIOps ayuda a los proveedores de servicios de comunicación a eliminar tareas manuales.

¿Comprar soluciones o desarrollarlas?, el dilema de Low-Code

Las soluciones low-code y no-code surgen cómo respuesta al dilema de las empresas que inician su viaje a la transformación digital ¿Comprar?

Principios básicos de ServiceOps y su impacto en el negocio

Analizamos ¿Qué es exactamente ServiceOps y por qué se está convirtiendo en una palabra de moda entre las organizaciones con visión de futuro?

Qué es IT Backlog y cómo está afectando las operaciones de TI

En el mercado altamente digitalizado de hoy, retrasar el desarrollo de aplicaciones es cotoso y el IT Backlog es el principal problema.

Guía completa sobre gestión de incidentes (parte 2)

La gestión de incidentes refiere a la atención de interrupciones del servicio. En este post analizamos algunos ejemplos y mejores prácticas.

Desventajas de la gestión de trabajo con hojas de cálculo e emails

Si la gestión de trabajo a través de correos electrónicos y hojas de cálculo causa frustración a tus equipos, necesitas un nuevo enfoque.

Simplifica la orquestación de datos en los servicios de comunicación

En el mundo hiperconectado, hablamos sobre los desafíos de los datos y la orquestación del flujo de trabajo y aplicaciones en la comunicación

Mejora tu estrategia Agile DevOps con BMC Helix ServiceOps

La tecnología heredada representa un problema para las estrategias de innovación tecnológica como Agile DevOps. Pero es posible superarlo

Cómo mejorar tu plan de respuesta a incidentes de seguridad

Sin un plan de respuesta a incidentes de seguridad, las organizaciones son vulnerables a daños extensos e interrupciones prolongadas.