Muerte súbita en los discos SSD

En la sección donde hablamos de la información técnica sobre los SSD intentamos responder a la pregunta de cuanto dura un SSD. Hablamos de los inconvenientes de los discos SSD, que son la degradación y la retención de datos. Esto nos lleva a la durabilidad de este tipo de discos duros, que se mide o expresa en TBW (TeraBytes escritos, del inglés TeraBytes Writen). Pero si bien todas estos problemas suelen aparecer a largo plazo, después de usar el SSD durante mucho tiempo o de manera intensiva, ¿que pasa cuando muere un SSD? Y ¿como muere un SSD? ¿Por qué se habla de muerte súbita en los discos SSD? Te explicamos como saber si tu disco SSD está muerto.

Problemas de los discos SSD

Por la forma en la que se escriben los datos en los chips de memoria SSD, cada celda sufre un desgaste con cada escritura. Así, después de un numero de escrituras, esa celda no pueda escribirse (cambiar su estado, o “programar”) mas veces, quedando inutilizable.

La durabilidad en los SSDs se calcula mediante los TBs escritos (TBW) que aguantan. Este dato lo proporciona el fabricante y nunca hay que tomarlo como una garantía de que el disco no va a estropearse antes de haber escrito esa cantidad de datos en su memoria.

Por otro lado, la memoria NAND no puede guardar los datos de manera indefinida si no recibe corriente eléctrica de vez en cuando, pues las pequeñas cargas eléctricas que forman nuestros datos se van perdiendo con el paso del tiempo. Muy lentamente, si, pero se va descargando. Cuantas mas cargas (bits) metamos en una misma celda (MLC, TLC, QLC…), mas pequeñas son estas cargas, lo que hará que se pierdan mas rápidamente todavía.

Para entender como muere un SSD, tenemos que hablar primero de como muere un HDD.

¿Como muere un HDD?

Un disco duro HDD tiene 2 partes diferenciadas. Por un lado tenemos los platos magnéticos giratorios, que es donde se guardan nuestros datos propiamente dichos, y por otro lado tenemos el circuito electrónico que controla los platos. Así que pueden pasar 2 cosas: que se estropee el circuito electrónico, o que fallen los platos, siendo este último caso el mas habitual.

hdd-inside

Si falla el circuito electrónico, todos los datos del disco quedan inaccesibles de golpe. La gran ventaja en el caso de los HDD es que los platos (nuestros datos) y la controladora están separados físicamente. Esto nos permite buscar otro disco duro del mismo modelo y exactamente la misma versión de fabricación, quitarle la placa donde están los circuitos electrónicos que forman la controladora del disco, y colocarla en el disco estropeado. De esta forma, es probable que podamos acceder de nuevo a los datos que están almacenados en los platos.

Por el contrario, si el problema está en los platos del disco, que es donde están los datos de usuario, la cosa es distinta. Como un plato no es un aparato electrónico, sino simplemente un trozo de material magnético, lo que suele pasar en estos casos es que empiezan a fallar algunos sectores del disco, dejando los archivos que había guardados en esos sectores inaccesibles (y corrompidos). Esto puede pasar si entra una mota de polvo en el disco, si el cabezal de lectura de los discos roza el plato… En este caso, lo que pasa es que unos pocos archivos quedan corrompidos y los perdemos, pero el resto de archivos del disco siguen estando ahí y siendo accesibles en su mayoría, no los perdemos.

hdd-balas

¿Como muere un SSD?

A diferencia de los discos HDD, un disco SSD no tiene platos magnéticos ni otras partes mecánicas, está compuesto solamente por elementos electrónicos. Estos elementos son la controladora (igual que en el caso de los HDD) y los chips de memoria donde se almacenan los datos. Además, estos 2 elementos están en la misma placa de circuito impreso, no están separadas como en el caso de los discos HDD. Esto implica que, si falla una de las 2 partes, sea la que sea, el resultado es el mismo: los datos quedan inaccesibles. Todos los datos del SSD.

Si falla la controladora, no podemos reemplazarla por otra igual, pues está soldada a la placa. Los chips tampoco los podemos reemplazar, pues en ellos están los datos y, si ponemos un chip nuevo, nuestros datos no estarán en el nuevo chip. Así pues, mientras que un disco HDD va fallando progresivamente, “avisando” con el hecho de que algún archivo no se puede leer, o mostrando valores de alerta en los datos SMART, un SSD falla de golpe, aunque su estado nos indique que está al 99% de vida útil, dejando todos sus datos inaccesibles de repente. Sin avisar. Lo perdemos todo en un segundo. De ahí el nombre de muerte súbita en los discos SSD.

ssd-parts

¿Por qué muere un SSD?

Para comprender por que muere un SSD, primero tenemos que explicar como funciona el disco. La controladora del SSD utiliza una parte de la memoria para almacenar datos que necesita para funcionar. Estos datos pueden ser el firmware (que vendría a ser el sistema operativo del disco, lo que le permite controlar todo lo que ocurre en el mismo), los datos SMART, las tablas de traducción de direcciones (FTL), las claves de encriptación del disco… Estos datos necesarios para que el sistema funcione ocupan entre 4 y 12 GBs.

Ya explicamos que la controladora mueve los datos de unas celdas a otras del SSD para evitar que sean siempre las mismas celdas las que se desgasten. Esto se llama Wear Leveling. El problema es que el espacio de sistema que la controladora requiere para poder funcionar, no se puede mover a otras celdas, siempre son las mismas. Es por lo tanto evidente, que esas celdas donde se encuentran los datos de sistema se desgastan más que el resto de celdas del disco.

destroyed ssd nand

Así pues, es de esperar que cuando alguna de las celdas que contienen los datos que la controladora necesita para hacer funcionar el disco, se estropee debido a haber sufrido demasiadas operaciones de escritura o borrado, los datos quedarán corruptos. De esta forma, la controladora no será capaz de hacer funcionar el disco y este quedará inutilizable, perdiendo todos los datos que tenia en sus memorias.

Otro motivo por el que un disco SSD puede morir de golpe, es un corte repentino de la alimentación eléctrica del SSD, pues cabe la posibilidad de que tuviera datos en caché que se estuvieran escribiendo al disco (o a ese espacio de sistema que la controladora necesita) y quede el disco inutilizable. Un caso más de muerte súbita en los discos SSD.

Exceso de escrituras a una celda de memoria del SSD

De los párrafos anteriores podemos deducir que, cuando una celda de memoria del SSD falla por haber realizado demasiadas operaciones de escritura o borrado sobre ella, todo el disco queda inutilizable. Esto es así si la celda contiene los datos del sistema que la controladora necesita para funcionar, pues ya hemos dicho que esos bloques no pueden moverse a otros. Pero los bloques que contienen datos de usuario si que pueden moverse a otras celdas (y de hecho lo hacen constantemente por el wear leveling).

Los discos SSD incorporan un espacio de memoria extra, formado por varios millones de celdas y no visible para el usuario, cuyo único objetivo es servir como reemplazo para las celdas de memoria del espacio de usuario que se puedan estropear en el futuro. Así pues, cuando la controladora detecta que una celda está cercana a fallar, o si ésta ya ha fallado, lo que hace la controladora es mover los datos de esa celda a una nueva celda de las que se encuentran en ese espacio extra. Luego actualiza la tabla TFL para saber que esos datos ahora se han movido y poder encontrarlos en el futuro, y marca la celda que ha fallado como mala, para no volver a escribir en ella.

Esto aumenta la vida del SSD, pues pueden fallar varios millones de celdas y el disco seguirá funcionando. El problema es que, aunque son bastantes, las celdas extra siguen siendo finitas, con lo que si se producen muchos fallos en celdas normales y estas celdas extra se acaban, el disco morirá. Aunque no es habitual, algunos discos dejan los datos en modo solo-lectura cuando esto pasa, de manera que puedes acceder a los datos para copiarlos, pero no puedes escribir nuevos datos al disco.

El ordenador no detecta el SSD, ¿está muerto?

Un día cualquiera encendemos el ordenador y el sistema operativo no carga. Windows da un fallo durante el arranque y no podemos usar el equipo. ¿Ha fallado el SSD? ¿Como saber si mi disco SSD está muerto?

broken-ssd

Si el SSD falla (muere), nuestros datos se habrán perdido y el PC no arrancará. Si esto pasa, podemos hacer varias cosas para confirmar si efectivamente es el disco duro SSD lo que ha fallado:

  • Acceder a la BIOS del equipo y mirar si esta detecta nuestro disco duro
  • Revisar los cables de datos y de alimentación del disco y verificar que estén todos bien conectados
  • Cambiar el cable de datos SATA del disco por otro
  • Probar con otro cable de alimentación del disco
  • Conectar el cable de datos SATA del disco a otro puerto SATA de la placa
  • Sacar el disco del equipo y conectarlo a otro PC
  • Conectar el disco mediante una carcasa externa USB a otro equipo

Si ninguna de estas cosas da resultado, es mas que probable que tu disco duro haya muerto y necesites comprar uno nuevo. Puedes pasarte por la sección de discos duros SSD recomendados para ver una tabla comparativa con los mejores discos del momento.

Para evitar que la muerte súbita de los discos SSD te cause problemas, la única solución es tener siempre copias de seguridad actualizadas de todos tus datos importantes.