arreglar particion con errores en disco
Juan Gomez (Txonta)
juantxonta en gmail.com
Mar Feb 26 10:48:57 UTC 2013
>/>>>> El 22 de febrero de 2013 20:50, Juan Gomez (Txonta) <juantxonta en gmail.com <https://lists.ubuntu.com/mailman/listinfo/ubuntu-es>
/>>/>>> escribió://
/>>>>>/Hola a todos.
/>>/>>> Llevo ya varios días lidiando con la recuperación de una partición con//errores, en un servidor
>>>>> debian skqueeze con 4 an~os ya; sirviendo un par de//webs de no mucho tráfico.
/>>/>>> Como de administrador de servidores ando dando los primeros pasos, pues//me he decidido a poner el tema
>>>>> en esta lista; tan destacada por sus// admirables y experimentados sysadmins.
/>>/>>> Haciendo >>>>> sudo fsck.ext4 -cvy /dev/sda6 >>>///home/juan/fsck-cvy_sda6-2.txt
/>>/>>> Falló la escritura al archivo así que he buscado donde se escribe un log// y he encontrado esto
>>>>> /var/log/messages puede ser este un log válido para//conocer el resultado de fsck.ext4 -cvy /dev/sda6 ?verdad?
>>>>> porque///var/log/fsck no contenía nada de valor. Aquí unos apuntes que fui sacando// mientras corría:
/>>/>>> en 23min hasta 91,76% ahí se estancó
/>>/>>> 11 horas después 91.77% done, 11:28:54 elapsed//
/>>/>>> hasta 7h después 91.78% done, 18:25:50 elapsed
/>>/>>> 2h y 1/2 después 92.00% done, 20:44:52 elapsed//
/>>/>>> 14 horas después 92.01% done, 34:56:07 elapsed
/>>/>>> 30 horas después 92.02% done, 63:37:20 elapsed
/>>/>>> 22 horas después 92.03% done, 85:38:20 elapsed 85 horas y 38// minutos después finalizó.
/>>/>>> En realidad -reflexiono- de 91,76% 92,03% solo va un 0,27% que supongo//es la parte con desarreglos ?mh?.
/>>/>>>/>>/>>> Bueno ya veis 86 horas de rutina y el servidor leeenitisimo, no está el//asunto para equivocaciones,
>>>>> ni comandos bien, bien contrastados.// Los errores reportados son -casi o prácticamente- todos de esta manera://
/>>/>>> Feb 21 18 txonta1 kernel: [791546.808255] sd 2:0:0:0: [sda]// Unhandled sense code
/>>/>>> Feb 21 18 txonta1 kernel: [791546.808285] sd 2:0:0:0: [sda]//Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
/>>/>>> Feb 21 18 txonta1 kernel: [791546.808339] sd 2:0:0:0: [sda] Sense//Key : Medium Error [current] [descriptor]
/>>/>>> Feb 21 18 txonta1 kernel: [791546.808395] Descriptor sense data//with sense descriptors (in hex):
/>>/>>> Feb 21 18 txonta1 kernel: [791546.808429]//
/>>/>>> Feb 21 18 txonta1 kernel: [791546.808478] 2e cd b1 d3
/>>/>>> Feb 21 18 txonta1 kernel: [791546.808509] sd 2:0:0:0: [sda] Add.
/>>/>>> Sense: Unrecovered read error - auto reallocate failed.
/>>/>>>/>>/>>> Bueno y hasta aquí, espero sus consejos; ?que le hago? smartmoontools,// badblocks, fsck.ext4 ?con que opciones?
>>>>> Cualquier información que sea útil// me la solicitan. Por mi parte les adelanto que ya estoy buscando otro
/>>/>>> disco, no porque no crea que este no vaya a durar sino porque creo que es//la solución que se acerca más a
>>>>> lo profesional, para evitar días de caídas//y demás contrariedades. Que un disco tiene problemas y/o necesita
/>>/>>> mantenimiento pues se usa el otro y este se le opera.//
/>>/>>> Gracias de antemano y felicitaciones por esta lista que hace a uno
/>>/>>> sentirse orgulloso.//
/>>/>>> Juan Gómez (Txonta) - * - www.tleo.es - * -
/------------------------------------------------------------
>/>>>//El 22/02/13 21:36, Daniel Carrasco Marín escribió://
/>/>>>// Que haya tardado tanto en pasar la comprobación del disco duro huele a//sectores defectuosos, y cuando un disco
>>>> duro da sectores defectuosos es// mejor que vayas pensando en hacer lo que has dicho, cambiarlo por otro// nuevo.
/>/>>>// También no se de que nivel adquisitivo dispones, pero a lo mejor te//viene bien poner dos discos duros y hacerte
>>>> un RAID1 (espejo), ya que// consigues tener dos copias idénticas de los datos, y en caso de fallo de//alguno de los
>>>> discos duros, siempre tendrás el otro funcionando y podrás// cambiar el dan~ado y reconstruir el RAID para que todo
>>>> vuelva a la// normalidad.//
/>/>>>// Un saludo.
------------------------------------------------------------
//>>>//El 23 de febrero de 2013 18:14, Juan Gomez (Txonta) <juantxonta en gmail.com <https://lists.ubuntu.com/mailman/listinfo/ubuntu-es>>escribió:
////>>>// Gracias Daniel por tu aportación.
//>>>//Si, lo de los dos discos en espejo es la idea que comentaba; comprar uno////idéntico a este y configurarlos como tu dices
>>> será la manera de minimizar// //riesgos y adquirir un perfil mas profesional.
//>>>//Pero de momento debo ir recuperando y reparando este y es a lo que se// //refiere el tema y la ayuda que solicito.
//>>>//?Cual es el procedimiento más apropiado o aconsejable para arreglar esa////partición con errores?
//>>>//Cuando digo procedimiento pienso en una orden por consola que se encargue////de:
//>>>//a) marcar los sectores defectuosos.
//>>>//b) arreglarlos en la medida de lo posible.
//>>>//Enfin y así conseguir que dejen de dar problemas, de ralentización en el// //arranque y demás.
//>>>//// //Gracias por vuestro interés.
//>>>//// //Juan Gómez (Txonta) - * - www.tleo.es - * -/
---------------------------------------------------------------
>> El 23 de febrero de 2013 13:37, Daniel Carrasco Marín <danielmadrid19 en gmail.com <https://lists.ubuntu.com/mailman/listinfo/ubuntu-es>> escribió:
/>>//Actualmente no tengo linux, ya que un juego que uso necesita de windows, y//la emulación con wine
>> no da de sí lo suficiente... pero he encontrado esto:// http://www.adslzone.net/postt270119.html
//>>//En el segundo post comenta un par de programas, uno es el fsck que usaste,// y el otro es el badblocks.//
//>>//También este://http://ubuntu-paranovatos.blogspot.com.es/2012/03/reparar-disco-duro-sectores-danados.html
//>>//que te propone los mismos programas, pero pone la línea de comando a usar// con fsck.//
//>>//Un saludo.
---------------------------------------------------------------
/> Daniel:
> Al parecer no te han quedado del todo claros los consejos que se te han dado en este canal y te puedo
> decir que he podido reparar varios discos duros con el procedimiento de badblooks, pero hay un límite
> y no todos se pueden reparar con eficiencia y eficacia, pues un disco duro que falla, tiene muchas, pero muchas,
> pero muchas posibilidades de volver a fallar. Sin embargo insistes en seguir con esa reparación, me parece
> muy bien como medio de experimentación, pero al final puede que tu disco reparado no sea del todo bueno su estado.
> Todo lo anterior en función de los datos que nos has dado.
> Suerte
> Con afecto, gusto y placer. Alfredo
-----------------------------------------------------------------
Juan Gómez (Txonta) escribió.
Hola Alfredo, Daniel y demás amigos de la lista.
Gracias por su tiempo, su interés y sus consejos.
Os comentaré que tengo bastantes nociones como para no andar muy desorientado con este tema, incluso
como para avanzar en el y solucionarlo por mis propios medios; pero ya que contamos con esta estupenda lista
y yo soy primerizo -me dije- ?porque no aprovechar y comentar, así yo voy muy bien asesorado y otros pueden aprender?
Si leemos el hilo vemos que -salvo que alguien que sepa más, diga lo contrario- nos encontramos con un disco con un
área de errores aproximada que se circunscribe a un 0,27%. El disco tiene 4 an~os, ha estado funcionando de modo
ininterrumpido como servidor y es después de una caída del fluido eléctrico -en realidad han sido varias- que muestra
estos errores. Yo creo que a grandes rasgos todos estaremos de acuerdo y todos haríamos mas o menos lo mismo:
- ante un disco que no arranca y te dice "error de disco ejecute fsck manualmente", pues todos haríamos eso para salvar
los errores, recuperar el disco y poderlo arrancar. Como este mensaje me daba uno igual en 4 particiones de 8
(incluidas swap y root) por suerte ninguna de las particiones criticas.
Ahora solo me quedan por arreglar 2, pero este sda6 pues fueron más de 80 horas así que o atino mucho o, no solo me
eternizo sino que lo mismo lo echo todo a perder.
Bien entonces esta es la situación, aclaro también que por supuesto no me voy a conformar con esto sino que una vez
reparado lo reparable le pondré otro disco, pues es la manera de evitar contratiempos como los que acabo de sufrir,
de tiempo y tiempo de servidor caído o leeentisimo. Bueno por supuesto pero si quiero clonar el disco antes debo repararlo
(según se explica por ahí) para evitar los sectores con defecto.
- bueno entonces si o si hay que hacer todo lo necesario para poner este disco en las mejores condiciones posibles.
Y aquí el tema consultado, procedimientos, métodos, herramientas, sentencias de consola...
Daniel he estado mirando los enlaces que apuntas: el comando $sudo fsck -c -y -v /dev/sda6 es el que ya le he pasado.
$sudo badblocks -s -v -n -f /dev/sdxx (escanea, corrige y repara, sin perder datos), dice también. Luego habla de:
$sudo badblocks -n -s -v -c 10240 /dev/sda6 -o badblocks.txt donde saca una lista de bloques defectuosos que después pasa
como argumento para formatear. Bueno y en el 2^(o) enlace dice que badblocks no se debiera invocar directamente sino con e2fsck
... sigo con dudas importantes. 1-) ?y smartmoontools? 2-) yo no quisiera formatear, puedo arreglar esos sectores erróneos
(con badblocks o sin el) sin formatear? como. 3-) la sentencia fsck.ext4 o e2fsck para recomponer todo lo posible el disco?
Bueno a continuación les dejo la salida de smartctl -c que según dicen muestra los test que se le pueden hacer a este disco.
$ sudo smartctl -c /dev/sda
=== START OF READ SMART DATA SECTION ===General SMART Values:
Offline data collection status: (0x84) Offline data collection
activity
was suspended by an interrupting command
from host.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous
self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: (8160) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data
before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 97) minutes.
Conveyance self-test routine
recommended polling time: ( 5) minutes.
SCT capabilities: (0x303f) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.
y el resultado del test corto: $ sudo smartctl -l selftest -H /dev/sda6
SMART overall-health self-assessment test result: PASSED
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours)
LBA_of_first_error
# 1 Short offline Completed: read failure 90%
24033 410123573
Bueno, hasta aquí le valió la parrafada, disculpen si me he enrrollado y
gracias por todo.
Si les parece aportamos nuestras opciones ya experimentadas y conocidas
y si son utiles en algo o a alguién pues enhorabuena.
Si quieren o sugieren nuevas pruebas o salidas de comandos no duden en
decírmelo. Si no fuera mucho liar man~ana les paso
la prueba extensa de smartctl.
Gracias y felicitaciones a todos los que hacen de esta una lista
ejemplar y a todos los que se benefician de ello.
Saludos y suerte.
Juan Gómez (Txonta) - * - www.tleo.es- * -
--
- * - www.tleo.es - * - mis webs
<http://sites.google.com/site/txontatleo/> - * - www.hacerteweb.com - * -
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <https://lists.ubuntu.com/archives/ubuntu-es/attachments/20130226/b78e2d9c/attachment-0001.html>
More information about the ubuntu-es
mailing list