Gestión y administración de la disponibilidad

Gestión y administración de la disponibilidad

La gestión y administración de la disponibilidad es un rol clave para garantizar el mejor funcionamiento de los entornos de ITSM, aunque es un rol nuevo que parece estar inmerso en otras posiciones, como en la gestión integral de servicios es esencial contar con un gerente en esta área que lleve a cargo diferentes tareas. A continuación te contamos cual es la importancia de la gestión de disponibilidad y las funciones del encargado de esta área.

“La nube es solo una computadora en Reston con una falla en la fuente de poder”.
Este fue el punto culminante del tweet del programador Andy Hunt después de un corte de AWS el 31 de agosto de 2019. El incidente provocó la pérdida de los datos de su organización y afectó a otras compañías, incluida Reddit . (Por suerte para Hunt, tenía copias de seguridad en otro lugar).

¿La causa principal? La falla de los generadores de respaldo de Amazon luego de un corte de energía en su centro de datos AWS US-EAST-1 en el norte de Virginia, lo que provocó que algunas instancias de EC2 y volúmenes de EBS incurrieran en daños en el hardware y posteriormente causaran una pérdida de datos irrecuperable: la pesadilla de cada organización.

La disponibilidad es el corazón de la gestión de servicios de TI: es lo que determina el valor del servicio de TI. Es también uno de los tres pilares de seguridad de la información según la CIA. Es por eso que, cuando clientes como Andy causan conmoción, se piensa que la disponibilidad no se trata con el cuidado adecuado, especialmente si el proveedor de servicios es lento y poco claro al comunicar el incidente y los esfuerzos parar solucionarlo.

Para evitar incidentes como el de Amazon, su posterior solución y esfuerzos de comunicación, echemos un vistazo a la administración de disponibilidad y el papel esencial del Gerente de disponibilidad.

Comprender la gestión de disponibilidad

De acuerdo con ITIL 4 , la disponibilidad es la capacidad de un servicio de TI u otro elemento de soporte para realizar sus funciones cuando sea necesario. Por lo tanto, si no puede iniciar sesión en Facebook, descargar sus correos electrónicos o acceder al panel de Salesforce, la reacción inmediata es considerar que el servicio no está disponible.

El propósito de la administración de disponibilidad es garantizar que los servicios brinden los niveles acordados para satisfacer las necesidades de los clientes y usuarios. Cuanto más crítico es un servicio para el cliente, más debe invertir la empresa en su disponibilidad. Obtenemos información sobre el mínimo de lo que comprende la gestión de disponibilidad del estándar ISO/IEC 20000:

» Evaluar y documentar los riesgos para la disponibilidad del servicio a intervalos regulares.

» Determinar y documentar los requisitos junto con los objetivos de disponibilidad del servicio, considerando los requisitos comerciales relevantes, los requisitos de servicio, los SLA y los riesgos.

» Monitoreo y registro de resultados de disponibilidad de servicios y comparación con objetivos

» Investigar y abordar casos de no disponibilidad no planificada

La gestión de disponibilidad funciona de la mano con otras prácticas, como la arquitectura, el cambio, la configuración, el lanzamiento, la implementación, la gestión de incidentes y problemas, todo para garantizar que elementos como la capacidad, la continuidad y la seguridad se diseñen, creen, implementen y administren efectivamente a lo largo de la vida del servicio, su infraestructura además de sus componentes subyacentes.

Se requiere una visión integral ya que existen innumerables riesgos de disponibilidad en el dominio ITSM, como certificados caducados, cambios de configuración mal planificados, errores humanos y fallas relacionadas con el proveedor, entre otros.

El monitoreo y la medición de la disponibilidad deben tener en cuenta tanto la vista de componentes (a través de eventos y alertas) como la vista del cliente (basada en quejas y patrones de uso). El éxito de la gestión de disponibilidad a nivel de servicio se medirá mediante dos métricas principales:

» Tiempo medio para restaurar el servicio (MTRS)
Con qué rapidez su empresa aborda la falta de disponibilidad, por ejemplo, 4 horas

» Tiempo medio entre fallas (MTBF)
La frecuencia de no disponibilidad, por ejemplo, dos veces al año

El enfoque de la gestión de la disponibilidad ha pasado del diseño de sistemas que son tolerantes a fallas (abordando MTBF) hacia el diseño de sistemas que se recuperan rápidamente. Esto ha presentado conceptos como el movimiento de software anti-frágil que se nutre de la volatilidad y la sorpresa. Las técnicas como el escalado automático, los microservicios y la ingeniería del caos ahora son bastante frecuentes en esta área.

El rol del administrador de disponibilidad

Si bien el título del puesto de Gerente de disponibilidad no es uno que se destaque en la era actual (aunque las organizaciones todavía reclutan para este rol), el papael de administrar la disponibilidad es parte integral de los entornos ITSM, particularmente aquellos de naturaleza operativa.

Curiosamente, el marco europeo de competencia electrónica no incluye la “Disponibilidad” en ningún título de sus 40 dimensiones de referencia ni en los 30 Perfiles europeos de roles profesionales de las TIC . Sin embargo, una búsqueda rápida revela que se requiere conocimiento de disponibilidad en varios roles y actividades:

  • Diseño arquitectónico
  • Gestión de problemas
  • Desarrollo de estrategias de seguridad de la información.
  • Gestión de la seguridad de la información
  • El rol de administrador de datos
  • El rol de experto en DevOps

Ya sea un arquitecto de soluciones, desarrollador de software, administrador de sistemas o especialista en soporte técnico, la gestión de disponibilidad siempre será crítica para sus KPI u OKR. Un excelente ejemplo es el ingeniero de confiabilidad del sitio (SRE): la disponibilidad se encuentra entre los elementos principales del rol, ya que es esencial para proteger, proporcionar y hacer progresar el software junto con los sistemas.

Disponibilidad de tareas y responsabilidades del gerente

Para tener una idea de las expectativas del gerente de disponibilidad, SFIA 7 define tres niveles de responsabilidad de administración de disponibilidad, clasificados en Entrega y Operación (subcategoría: Diseño del Servicio). Estos son ejemplos de niveles de responsabilidad, por lo que un gerente de disponibilidad para estos niveles estaría en liderazgo y/o tendría cierta experiencia significativa:

Gestión de disponibilidad: Nivel 4

» Contribuye al proceso de administración de disponibilidad, su operación y realiza tareas definidas de administración.

» Analiza la disponibilidad, confiabilidad, manutención y facilidad de los componentes y servicios.

» Asegura que los servicios y componentes cumplan y continúen su función con todos los objetivos de rendimiento a niveles de servicio acordados.

» Implementa arreglos para recuperación de desastres y procedimientos de recuperación de documentos.

» Realiza pruebas de procedimientos de recuperación.

Gestión de disponibilidad: Nivel 5

» Brinda asesoramiento, asistencia y liderazgo asociados con la planificación, el diseño y la mejora de la disponibilidad de los servicios y componentes, incluida la investigación de todos los objetivos no cumplidos de los objetivos además de la no disponibilidad del servicio, con el impulso de actividades correctivas.

» Planea los arreglos para la recuperación ante desastres junto con los procesos de apoyo y gestiona las pruebas de dichos planes.

Gestión de disponibilidad: nivel 6

Establece políticas y desarrolla estrategias, planes y procesos para el diseño, monitoreo, medición, mantenimiento, informes y mejora continua de la disponibilidad de servicios y componentes, incluido el desarrollo e implementación de nuevas técnicas junto con nuevos métodos de disponibilidad.

Para una administración de disponibilidad clara y procesable que se alinee con el servicio de TI y la administración de operaciones de su empresa, es fundamental implementar la estrategia correcta. Las estrategias más exitosas están respaldadas por las herramientas adecuadas que satisfacen las necesidades de su empresa.

A medida que las organizaciones se enfocan en la transformación digital, requieren la capacidad de lanzar versiones nuevas, actualizar y automatizar con rapidez los servicios para apoyar el crecimiento. BMC Helix ITSM ofrece competencias de gestión de cambios completas e intuitivas.

¿Estás listo para probar las soluciones de BMC? Ponte en contacto con el equipo de expertos de Insitech quien te orientará para elegir la solución que se adapte mejor a las necesidades de tu negocio.

Consulta la información original en inglés.

Tipos de plataformas low-code

En el siguiente blog analizamos diferentes desafíos que atraviesan las empresas y los tipos de herramientas low-code que pueden ayudarte.

Transformación digital con ayuda de Low-Code

La transformación digital implica muchos desafíos, pero con ayuda de Low-code podemos superar estos problemas y abrir el camino para el cambio

5 consejos para elegir la suite de Gestión de Procesos de Negocio (BPM)

El enfoque de suite de gestión de procesos empresariales ayuda en el ciclo de vida de mejora de procesos como analizamos en este blog.

Plataforma de código abierto low-code, qué es y cuáles son sus ventajas

En el siguiente blog exploramos la definición de las plataformas de código abierto low-code, sus ventajas y desventajas

Plataformas no-code frente a los problemas de TI

Ingresa en nuestro blog para aprender cómo las plataformas no-code ayudan a resolver los problemas en los departamentos de TI

Características de los sistemas de low-code qué los hace mejores

En el siguiente blog hablamos sobre el impacto de los sistemas low-code en el desarrollo de aplicaciones y sus ventajas en los negocios

6 puntos clave para elegir la plataforma RAD adecuada

El siguiente blog analizamos el desarrollo de aplicaciones RAD y las características que debe tener para tu negocio.

No-code: qué es y cómo aplicarlo en el desarrollo sin código

Con la llegada de la programación no-code, diseñar las soluciones que tu empresa necesita es más fácil, descubre cómo lograrlo en este post

Los 6 principales desafíos en adquisiciones que enfrentan las empresas

En este blog analizamos los principales problemas en el área de adquisiciones que enfrentan las empresas de todos los tamaños

7 beneficios de implementar el desarrollo ciudadano

Con el desarrollo ciudadano tu empresa puede eliminar los cuellos de botella y reducir la carga de trabajo de TI. Descubre más en este blog