RAID

  • Un problema que suele ocurrir con mayor frecuencia que la esperada, es la rotura de un disco rígido en un servidor. El día más temido por todo SysAdmin improvisado. Sin embargo, los SysAdmins semi-decentes utilizamos arreglos de discos en alguna configuración RAID (1, 5 10, RAIDZ, o por software en sistemas Linux). Ahora bien, supongamos que se rompió un disco y hay que cambiarlo, ¿cómo identificar el disco físico fallido asociado al dispositivo en cuestión? Este artículo explica la técnica correcta y menciona otras, también válidas, y otras más un tanto extrañas.

  • Verano, época de calor y cortes de luz. Si no disponemos de una fuente de energía eléctrica confiable, UPS de gran autonomía y generadores, nuestros discos lo sufren en grande. Y este fue el caso de uno de los discos en uno de mis servidores DELL PowerEdge, el cual, luego de uno de los lamentablemente frecuentes cortes de luz, quedó inutilizable. Afortunadamente (mentira, el trabajo de un sysadmin tiene poco que ver con la fortuna y mucho que ver con la planificación) era parte de un RAID 1, configuración de discos espejados, esquema tradicional para instalar el sistema operativo en servidores físicos (para datos se suelen utilizar otras configuraciones, como RAID 5 ó 10, con uno o más discos hot spare), por lo que no se ocasionaron pérdidas de datos. Pero sí un downtime importante, porque la controladora PERC H200 no fue capaz de inicializar el arreglo en modo degradado (utilizando un solo disco), tal vez debido a que fue un fallo de disco muy grave.