arreglar particion con errores en disco

Juan Gomez (Txonta) juantxonta en gmail.com
Mar Feb 26 10:48:57 UTC 2013


>/>>>> El 22 de febrero de 2013 20:50, Juan Gomez (Txonta) <juantxonta en gmail.com  <https://lists.ubuntu.com/mailman/listinfo/ubuntu-es>
/>>/>>>  escribió://
/>>>>>/Hola a todos.
/>>/>>> Llevo ya varios días lidiando con la recuperación de una partición con//errores, en un servidor
>>>>> debian skqueeze con 4 an~os ya; sirviendo un par de//webs de no mucho tráfico.
/>>/>>> Como de administrador de servidores ando dando los primeros pasos, pues//me he decidido a poner el tema
>>>>> en esta lista; tan destacada por sus//  admirables y experimentados sysadmins.
/>>/>>> Haciendo >>>>>    sudo fsck.ext4 -cvy /dev/sda6 >>>///home/juan/fsck-cvy_sda6-2.txt
/>>/>>> Falló la escritura al archivo así que he buscado donde se escribe un log//  y he encontrado esto
>>>>> /var/log/messages puede ser este un log válido para//conocer el resultado de fsck.ext4 -cvy /dev/sda6 ?verdad?
>>>>> porque///var/log/fsck no contenía nada de valor. Aquí unos apuntes que fui sacando//  mientras corría:
/>>/>>>     en 23min hasta       91,76% ahí se estancó
/>>/>>>     11 horas después   91.77% done, 11:28:54 elapsed//
/>>/>>>     hasta 7h después   91.78% done, 18:25:50 elapsed
/>>/>>>         2h y 1/2 después  92.00% done, 20:44:52 elapsed//
/>>/>>>     14 horas después   92.01% done, 34:56:07 elapsed
/>>/>>>     30 horas después   92.02% done, 63:37:20 elapsed
/>>/>>>     22 horas después   92.03% done, 85:38:20 elapsed  85 horas y 38//  minutos después finalizó.
/>>/>>> En realidad -reflexiono- de 91,76% 92,03% solo va un 0,27% que supongo//es la parte con desarreglos ?mh?.
/>>/>>>/>>/>>> Bueno ya veis 86 horas de rutina y el servidor leeenitisimo, no está el//asunto para equivocaciones,
>>>>> ni comandos bien, bien contrastados.//  Los errores reportados son -casi o prácticamente- todos de esta manera://
/>>/>>> Feb 21 18 txonta1 kernel: [791546.808255] sd 2:0:0:0: [sda]//  Unhandled sense code
/>>/>>> Feb 21 18 txonta1 kernel: [791546.808285] sd 2:0:0:0: [sda]//Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
/>>/>>> Feb 21 18 txonta1 kernel: [791546.808339] sd 2:0:0:0: [sda] Sense//Key : Medium Error [current] [descriptor]
/>>/>>> Feb 21 18 txonta1 kernel: [791546.808395] Descriptor sense data//with sense descriptors (in hex):
/>>/>>> Feb 21 18 txonta1 kernel: [791546.808429]//
/>>/>>> Feb 21 18 txonta1 kernel: [791546.808478]         2e cd b1 d3
/>>/>>> Feb 21 18 txonta1 kernel: [791546.808509] sd 2:0:0:0: [sda] Add.
/>>/>>> Sense: Unrecovered read error - auto reallocate failed.
/>>/>>>/>>/>>> Bueno y hasta aquí, espero sus consejos; ?que le hago? smartmoontools,//  badblocks, fsck.ext4 ?con que opciones?
>>>>> Cualquier información que sea útil//  me la solicitan. Por mi parte les adelanto que ya estoy buscando otro
/>>/>>> disco, no porque no crea que este no vaya a durar sino porque creo que es//la solución que se acerca más a
>>>>> lo profesional, para evitar días de caídas//y demás contrariedades. Que un disco tiene problemas y/o necesita
/>>/>>> mantenimiento pues se usa el otro y este se le opera.//
/>>/>>> Gracias de antemano y felicitaciones por esta lista que hace a uno
/>>/>>> sentirse orgulloso.//
/>>/>>> Juan  Gómez (Txonta)        - * - www.tleo.es - * -
/------------------------------------------------------------
>/>>>//El 22/02/13 21:36, Daniel Carrasco Marín escribió://
/>/>>>//  Que haya tardado tanto en pasar la comprobación del disco duro huele a//sectores defectuosos, y cuando un disco
>>>> duro da sectores defectuosos es//  mejor que vayas pensando en hacer lo que has dicho, cambiarlo por otro//  nuevo.
/>/>>>//  También no se de que nivel adquisitivo dispones, pero a lo mejor te//viene bien poner dos discos duros y hacerte
>>>> un RAID1 (espejo), ya que//  consigues tener dos copias idénticas de los datos, y en caso de fallo de//alguno de los
>>>> discos duros, siempre tendrás el otro funcionando y podrás//  cambiar el dan~ado y reconstruir el RAID para que todo
>>>> vuelva a la//  normalidad.//
/>/>>>//  Un saludo.
------------------------------------------------------------
//>>>//El 23 de febrero de 2013 18:14, Juan Gomez (Txonta) <juantxonta en gmail.com  <https://lists.ubuntu.com/mailman/listinfo/ubuntu-es>>escribió:
////>>>//  Gracias Daniel por tu aportación.
//>>>//Si, lo de los dos discos en espejo es la idea que comentaba; comprar uno////idéntico a este y configurarlos como tu dices
>>> será la manera de minimizar//  //riesgos y adquirir un perfil mas profesional.
//>>>//Pero de momento debo ir recuperando y reparando este y es a lo que se//  //refiere el tema y la ayuda que solicito.
//>>>//?Cual es el procedimiento más apropiado o aconsejable para arreglar esa////partición con errores?
//>>>//Cuando digo procedimiento pienso en una orden por consola que se encargue////de:
//>>>//a) marcar los sectores defectuosos.
//>>>//b) arreglarlos en la medida de lo posible.
//>>>//Enfin y así conseguir que dejen de dar problemas, de ralentización en el//  //arranque y demás.
//>>>////  //Gracias por vuestro interés.
//>>>////  //Juan  Gómez (Txonta)        - * - www.tleo.es - * -/
---------------------------------------------------------------
>> El 23 de febrero de 2013 13:37, Daniel Carrasco Marín <danielmadrid19 en gmail.com  <https://lists.ubuntu.com/mailman/listinfo/ubuntu-es>> escribió:
/>>//Actualmente no tengo linux, ya que un juego que uso necesita de windows, y//la emulación con wine
>> no da de sí lo suficiente... pero he encontrado esto://  http://www.adslzone.net/postt270119.html
//>>//En el segundo post comenta un par de programas, uno es el fsck que usaste,//  y el otro es el badblocks.//
//>>//También este://http://ubuntu-paranovatos.blogspot.com.es/2012/03/reparar-disco-duro-sectores-danados.html
//>>//que te propone los mismos programas, pero pone la línea de comando a usar//  con fsck.//
//>>//Un saludo.
---------------------------------------------------------------
/> Daniel:
> Al parecer no te han quedado del todo claros los consejos que se te han dado en este canal y te puedo
> decir que he podido reparar varios discos duros con el procedimiento de badblooks, pero hay un límite
> y no todos se pueden reparar con eficiencia y eficacia, pues un disco duro que falla, tiene muchas, pero muchas,
> pero muchas posibilidades de volver a fallar. Sin embargo insistes en seguir con esa reparación, me parece
> muy bien como medio de experimentación, pero al final puede que tu disco reparado no sea del todo bueno su estado.
> Todo lo anterior en función de los datos que nos has dado.
> Suerte
> Con afecto, gusto y placer. Alfredo
-----------------------------------------------------------------
Juan Gómez (Txonta)  escribió.
Hola Alfredo, Daniel y demás amigos de la lista.
  Gracias por su tiempo, su interés y sus consejos.
Os comentaré que tengo bastantes nociones como para no andar muy desorientado con este tema, incluso
como para avanzar en el y solucionarlo por mis propios medios; pero ya que contamos con esta estupenda lista
y yo soy primerizo -me dije- ?porque no aprovechar y comentar, así yo voy muy bien asesorado y otros pueden aprender?

  Si leemos el hilo vemos que -salvo que alguien que sepa más, diga lo contrario- nos encontramos con un disco con un
área de errores aproximada que se circunscribe a un 0,27%. El disco tiene 4 an~os, ha estado funcionando de modo
ininterrumpido como servidor y es después de una caída del fluido eléctrico -en realidad han sido varias- que muestra
estos errores. Yo creo que a grandes rasgos todos estaremos de acuerdo y todos haríamos mas o menos lo mismo:
- ante un disco que no arranca y te dice "error de disco ejecute fsck manualmente", pues todos haríamos eso para salvar
  los errores, recuperar el disco y poderlo arrancar. Como este mensaje me daba uno igual en 4 particiones de 8
(incluidas swap y root) por suerte ninguna de las particiones criticas.
Ahora solo me quedan por arreglar 2, pero este sda6 pues fueron más de 80 horas así que o atino mucho o, no solo me
  eternizo sino que lo mismo lo echo todo a perder.
  Bien entonces esta es la situación, aclaro también que por supuesto no me voy a conformar con esto sino que una vez
reparado lo reparable le pondré otro disco, pues es la manera de evitar contratiempos como los que acabo de sufrir,
de tiempo y tiempo de servidor caído o leeentisimo. Bueno por supuesto pero si quiero clonar el disco antes debo repararlo
(según se explica por ahí) para evitar los sectores con defecto.
- bueno entonces si o si hay que hacer todo lo necesario para poner este disco en las mejores condiciones posibles.
Y aquí el tema consultado, procedimientos, métodos, herramientas, sentencias de consola...

  Daniel he estado mirando los enlaces que apuntas: el comando $sudo fsck -c -y -v /dev/sda6  es el que ya le he pasado.
$sudo badblocks -s -v -n -f /dev/sdxx (escanea, corrige y repara, sin perder datos), dice también. Luego habla de:
$sudo badblocks -n -s -v -c 10240 /dev/sda6 -o badblocks.txt donde saca una lista de bloques defectuosos que después pasa
como argumento para formatear. Bueno y en el 2^(o) enlace dice que badblocks no se debiera invocar directamente sino con e2fsck
... sigo con dudas importantes. 1-) ?y smartmoontools? 2-) yo no quisiera formatear, puedo arreglar esos sectores erróneos
(con badblocks o sin el) sin formatear? como. 3-) la sentencia fsck.ext4 o e2fsck para recomponer todo lo posible el disco?

Bueno a continuación les dejo la salida de smartctl -c que según dicen muestra los test que se le pueden hacer a este disco.

    $ sudo smartctl -c /dev/sda
    === START OF READ SMART DATA SECTION ===General SMART Values:

        Offline data collection status:  (0x84) Offline data collection
        activity
                             was suspended by an interrupting command
        from host.
                             Auto Offline Data Collection: Enabled.
        Self-test execution status:      (   0)    The previous
        self-test routine completed
                             without error or no self-test has ever
                             been run.
        Total time to complete Offline
        data collection:          (8160) seconds.
        Offline data collection
        capabilities:              (0x7b) SMART execute Offline immediate.
                             Auto Offline data collection on/off support.
                             Suspend Offline collection upon new
                             command.
                             Offline surface scan supported.
                             Self-test supported.
                             Conveyance Self-test supported.
                             Selective Self-test supported.
        SMART capabilities:            (0x0003)    Saves SMART data
        before entering
                             power-saving mode.
                             Supports SMART auto save timer.
        Error logging capability:        (0x01)    Error logging supported.
                             General Purpose Logging supported.
        Short self-test routine
        recommended polling time:      (   2) minutes.
        Extended self-test routine
        recommended polling time:      (  97) minutes.
        Conveyance self-test routine
        recommended polling time:      (   5) minutes.
        SCT capabilities:            (0x303f)    SCT Status supported.
                             SCT Error Recovery Control supported.
                             SCT Feature Control supported.
                             SCT Data Table supported.

y el resultado del test corto: $ sudo smartctl -l selftest -H /dev/sda6

    SMART overall-health self-assessment test result: PASSED
    SMART Self-test log structure revision number 1
    Num  Test_Description    Status Remaining  LifeTime(hours) 
    LBA_of_first_error
    # 1  Short offline       Completed: read failure 90%    
    24033         410123573

Bueno, hasta aquí le valió la parrafada, disculpen si me he enrrollado y 
gracias por todo.
Si les parece aportamos nuestras opciones ya experimentadas y conocidas 
y si son utiles en algo o a alguién pues enhorabuena.
Si quieren o sugieren nuevas pruebas o salidas de comandos no duden en 
decírmelo. Si no fuera mucho liar man~ana les paso
la prueba extensa de smartctl.
Gracias y felicitaciones a todos los que hacen de esta una lista 
ejemplar y a todos los que se benefician de ello.
Saludos y suerte.
Juan Gómez (Txonta)    - * - www.tleo.es- * -
-- 
- * - www.tleo.es - * - mis webs 
<http://sites.google.com/site/txontatleo/> - * - www.hacerteweb.com - * -
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <https://lists.ubuntu.com/archives/ubuntu-es/attachments/20130226/b78e2d9c/attachment-0001.html>


More information about the ubuntu-es mailing list