jueves, 13 de enero de 2011

¿Cómo hacer un Plan de Contingencia?

A medida que las organizaciones dependen más y más de la tecnología, que se ha convertido en un componente clave de la mayor parte de los procesos de negocio, la disponibilidad de los servicios de TI es imprescindible para su supervivencia. Esta disponibilidad se consigue mediante la definición e implementación de un Plan de Contingencia cuyo objetivo consiste en garantizar que se puede recuperar la infraestructura de TI que soporta dichos servicios dentro de los plazos y con el nivel de servicio acordado y necesario para el negocio.

Beneficios
  1. Reducción de aquellos riesgos que, en caso de materializarse las amenazas que les originan, pueden representar pérdidas ingentes de capital, bien por facturación fallida, por reposición de los daños causados, por pérdida de oportunidad de negocio, por reclamación de clientes, por sanciones legales, etc.
  2. Ahorro de tiempo y dinero al afrontar y corregir situaciones nefastas antes de que ocurran y nos obliguen a resolverlas con prisas y a cualquier precio.
  3. Mejora de la imagen y revalorización de la confianza en la empresa de los accionistas, inversores, empleados, proveedores y clientes al mostrarles que se toman medidas diarias para garantizar la continuidad del negocio.

Retorno de la Inversión

La metodología para desarrollar el plan tiene como objetivo principal ayudar a la organización a garantizar que se implementan las medidas y estrategias de recuperación que el negocio realmente necesita y puede permitirse.

Es fundamental, por tanto, entender que significa para el negocio la no disponibilidad de sus sistemas y realizar las acciones y planes necesarios para evitar que ocurra. La clave para lograr esta comprensión es la calificación (la validación con el negocio) de lo que significa realmente el tiempo de inactividad y, a continuación, la cuantificación (medición) de las consecuencias para el negocio. Se trata, por tanto, de estimar el coste de mejorar la infraestructura de TI actual frente a las pérdidas por no disponibilidad.

Metodología

Básicamente, un proyecto de Plan de Contingencia consiste en:

  1. Análisis de impacto en el negocio. Consiste en identificar los procesos más críticos del negocio, los servicios de TI que los soportan, determinar el impacto si uno o varios de estos servicios de TI se ven afectados total o parcialmente y definir los requerimientos de recuperación establecidos por el negocio – tiempo máximo de interrupción y máxima pérdida de datos permitida -.
  2. Análisis de riesgos. Consiste en estimar el riesgo potencial al que están sometidos los sistemas de TI, evaluando el impacto asociado a la materialización de una amenaza, y definir aquellas recomendaciones o controles preventivos que permitan reducir o eliminar dicho riesgo.
  3. Definición de las estrategias de recuperación. Consiste en establecer los escenarios de recuperación en función de las amenazas determinadas en el análisis de riesgos y los requerimientos de negocio definidos en el análisis de impacto. En esta fase se define el escenario tecnológico óptimo para soportar los procesos de negocio, atendiendo a las disponibilidades del servicio.
  4. Desarrollo e implementación del Plan de Contingencia. Una vez definida la estrategia de recuperación, el plan debe definir y establecer aquellos procedimientos, manuales técnicos y checklists funcionales que permitan restaurar los servicios de TI (sistemas, operaciones y datos) después de una emergencia o afectación total o parcial de estos servicios. La implementación del plan consiste en la ejecución de las recomendaciones establecidas en el análisis de riesgos y el escenario tecnológico definido.
  5. Prueba y mantenimiento del plan. Las pruebas del plan son esenciales para identificar las deficiencias de planificación y preparación del personal. Además, el plan debe ser un documento vivo que se actualiza periódicamente para mantenerse al día con los cambios en los sistemas de TI.

Aspectos importantes a tener en cuenta:

  1. Es aconsejable, en algunos casos imprescindible, utilizar una herramienta para realizar el análisis de riesgos. En el mercado existen diversas herramientas y cada una de ellas tiene sus ventajas e incovenientes: PILAR, Meycor, Proteus, Ecija (PCN, SGSI), etc.
  2. Es necesario definir los procesos de continuidad y disponibilidad de TI que permitan mantener actualizado el plan frente a los cambios continuos de la infraestructura y servicios de TI, considerando de forma especial su integración con el proceso de gestión de cambios.
  3. Un punto delicado es la definición de los criterios de activación del plan. El plan debería activarse cuando la evaluación de los daños indique que se han cumplido uno o más de estos criterios.
  4. Las estrategias de recuperación nos definen el escenario tecnológico que cumple con los criterios de continuidad del negocio. El desarrollo del plan de contingencia asociado puede verse aplazado hasta la implementación de dicho escenario. Esto puede conllevar una inversión económica considerable que deberá pasar, entre otras cosas, por un proceso de aprobación que se puede dilatar en el tiempo. Entre tanto, es aconsejable definir un plan provisional basado en "best effort" - intentar solucionarlo lo antes posible - que prevea qué hacer en caso de activación del plan.