HPE InfoSight: un caso para el Dr. House

HPE InfoSight: un caso para el Dr. House

Cómo funciona HPE InfoSight a través de un caso de uso real

Continuando con los artículos sobre el ecosistema Nimble y sobre todo con la herramienta de monitorización InfoSight, vamos a ver cómo nos puede ayudar a solucionar nuestros problemas y a optimizar nuestra infraestructura.

Antes de empezar, conoce un poco más HPE Nimble Storage

Si quieres saberlo todo, ¡consigue AQUÍ el webinar íntegro!

 

En esta ocasión voy a cambiar el enfoque que suelo dar a mis artículos, y basándome en un caso real, vamos a desarrollarlo como una serie de televisión de uno de mis personajes favoritos.

El caso HPE InfoSight

El paciente nos indica que tiene problemas con el almacenamiento y que sus máquinas virtuales van lentas, que si la cabina no funciona, etc., la historia que se suele repetir frecuentemente. Lo fácil sería cambiar cabina, a poder ser all-flash, y a ver si con esto lo solucionamos.

¿Pero, que haría House en nuestra situación?

Vamos a analizarlo bajo su enfoque: descartamos que sea lupus, porque no se ha confirmado que los servidores y el almacenamiento sean humanos. 🙂

Vamos a por la segunda premisa: todos mienten, algunos no son conscientes de que mienten, y su verdad no corresponde a la VERDAD. Dejando la metafísica a un lado, vamos a trabajar sobre esta hipótesis:

Normalmente, los datos que obtenemos son siempre “mirando” desde el host hacia el almacenamiento, por lo que vemos que el host nos indica una latencia importante en el almacenamiento. Pero, y aquí viene el detalle, no sabemos en qué parte de la pila de la infraestructura de almacenamiento tenemos el problema, si en la HBA de acceso al almacenamiento, en la red, o en la controladora de la cabina o en los discos de la misma. Así puede estar no diciendo toda la verdad, sin saberlo.

Cambiar de punto de vista con InfoSight

InfoSight nos va a permitir cambiar el punto de vista y ver el problema “mirando” desde la cabina hacia fuera.

Para ello nos vamos a conectar a nuestras cabinas y vamos a ver que encontramos desde este nuevo punto de vista. De entrada, vamos a ver el estado de salud de los sistemas. (Para mantener el anonimato del paciente taparemos los datos identificativos).

Un caso de uso real de HPE InfoSight: Estado de salud de los sistemas

 

Vemos que hay un problema, pero que el caso se ha autocerrado, como es simplemente la falta de recepción del hearbeat por parte del portal y el cliente confirma la caída de las líneas de internet, descartamos esta vía.

Vamos a mirar el estado operativo.

Un caso de uso real de HPE InfoSight: Estado operativo

¡¡¡Vaya!!! Este valor de latencia no es normal, sino todo lo contrario. Es buena línea de investigación, vamos a seguir trabajando en ello.

Un caso de uso real de HPE InfoSight: Valor de latancia anormal

 

La latencia en la cabina, tiene valores aceptables y que están dentro de lo normal. Vamos a tener que analizar otra cosa.

Un caso de uso real de HPE InfoSight: La latancia en las cabinas es normal, ¿que tendremos que mirar?

 

Descartamos también que sea un problema de controladora, porque los valores de CPU y de cache son normales.

Un caso de uso real de HPE InfoSight: Valores de CPU normales

 

Miramos la latencia a nivel de volumen y datastore y tampoco parece que sea. El caso se complica. Tendremos que mirar a nivel de máquinas virtuales, por lo que ponemos a trabajar al equipo y que criben los datos.

Un caso de uso real de HPE InfoSight: Nivel de máquinas virtuales

 

¡¡¡Por fin!!! Foreman ha detectado una anomalía. Vemos que esta máquina nos está generando valores muy altos de latencia. Vamos a ver de dónde viene haciendo un zoom sobre uno de los picos.

Un caso de uso real de HPE InfoSight: Ver con zoom la máquina con valores anómalos

 

Vaya, parece que el problema está a nivel de host y que es de escritura.

Una vez detectado el problema con InfoSight…, la solución

Después de descartar que otras máquinas en el mismo host y en el mismo pool de almacenamiento tuvieran problemas de latencia, sólo nos quedaba una posible solución. El problema residía en un proceso que ejecutaba esta máquina y que reescribía gran cantidad de datos, lo que bloqueaba la pila de almacenamiento a nivel host, generando estos valores tan altos.

 


Vea íntegro nuestro webinar sobre HPE Nimble Storage

Vea íntegro el webinar

Webinar HPE Nimble Storage

¿No pudiste participar en nuestro webinar? No te preocupes, rellena el formulario y recibirás un enlace para poder verlo íntegramente.

 

Ver webinar >>

 


 

Responsable de Producto Soluciones Datacenter en Inycom

Leave A Reply