Festplatte kontrollieren

Florian Gross florian at grossing.de
Mo Dez 14 13:16:58 GMT 2009


Am So Dezember 13 2009 glaubte Luise Kunkle zu wissen:
> On Sun, 13 Dec 2009, Florian Gross wrote:
> > Am So Dezember 13 2009 glaubte Luise Kunkle zu wissen:
> >> On Wed, 9 Dec 2009, Florian Gross wrote:
> >>> Am Di Dezember 8 2009 glaubte Gitano zu wissen:
> >>>> Luise Kunkle wrote:

[SMART- Angaben auslesen]

> > $grep -v Temperature sda.log > sda2.log
> >
> > Dann schau mal nach, was in sda2.log überlebt hat.
> >
> Ich habe es etwas anders gemacht

Ist ja auch ein Linux. Irgendwie gibt es immer mehrere Wege ;-)

> (mit dem viewer von mc nach 
> var/log/messages gegangen und als Suchstring Temperature eingegeben.) Die 

Ähm, das von mir oben genannte "grep -v Temperature" zeigt alle
Zeilen an, die "Temperature" /nicht/ enthalten.

Wenn die Festplattentemperatur für einen Ausfall verantwortlich ist,
ist meist auch das restliche System temperaturmäßig am Ansatz.
Meist... wenn man natürlich 4 Festplatten direkt aufeinander legt und
jegliche Kühlung unterbindet, dann sollte man die Temperatur im Auge
behalten.

Ich hab Festplatten schon so heiß bekommen, daß man sie nicht mehr
anfassen konnte (ist schon gut 12 Jahre her), die haben das aber
jahrelang mitgemacht.

> logs sind ab 19. Nov. noch da - der Suchbegriff ist nicht aufgetaucht. 
> Aber da die Temp.  mit hddtemp als
> 
> *******
> sem-pa at xubuntu:~$ hddtemp /dev/sdb
> /dev/sdb: SAMSUNG HD160JJ: 21°C
> sem-pa at xubuntu:~$ 
> ******
> 
> ausgeggeben wird und bisher (seit einigen Tagen, auch nach langer Sitzung) 
> nicht über 29° waren, sollte dies wohl eher das Problem nicht sein.

Eben. Starke und schnelle Temperaturschwankungen wären eher ein
Problem. Gleichmäßig hohe Temperaturen verkürzen zwar die Lebensdauer
etwas, sind aber eigentlich kein Problem. Ich hab Festplatten jahrelang
mit ca. 45°C gefahren, und das im Dauerbetrieb. Aber halt ohne
großartige Temperaturschwankungen.

[smartctl]
> > $smartctl -a /dev/sda | grep -A 25 Thresholds
> >
> > sollte die relevanten Daten auswerfen (bei mir reicht -A 20).
 
[...]

> Bei der sda aller sind auch alle Werte hoch über dem jeseiligen treshold, 
> aber es gibt einen error count von 4 - und dazu eine Meldung, die ich 
> nicht verstehe: Weißt Du dazu was?

[...]

Nicht viel, ich werfe halt die gerne die Meldungen in einer
Suchmaschine ein und les mir mal durch. ob das andere schon
hatten und eine Lösung gefunden haben.
 
> *********
> Error 4 occurred at disk power-on lifetime: 1341 hours (55 days + 21 
> hours)

Es gab vorher schon drei Fehler.

>    When the command that caused the error occurred, the device was active 
> or idle.
> 
>    After command completion occurred, registers were:
>    ER ST SC SN CL CH DH
>    -- -- -- -- -- -- --
>    84 51 00 b4 49 e9 e8  Error: ICRC, ABRT at LBA = 0x08e949b4 = 149506484

Was ICRC und ABRT bedeuten, steht in der Manpage. ;-)

| ICRC:  Interface Cyclic Redundancy Code (CRC) error
| ABRT:  Command ABoRTed
 
>    Commands leading to the command that caused the error were:
>    CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
>    -- -- -- -- -- -- -- --  ----------------  --------------------
>    c8 00 00 b4 49 e9 e8 00      05:57:05.250  READ DMA

Bei manchen kam ein solcher Fehler wohl wegen defekter
Datenleitung. Die wurde schonmal getauscht?

Und sonst: kopiere mal die Ausgabe von smartctl -a /dev/sdb
nach http://pastebin.org und laß mir den Link zukommen.
Ich frag mal in der opensuse-de nach, ob da jemand was findet.

Du kannst auch mal unter
http://de.nntp2http.com/comp/hardware/laufwerke/festplatten/
nachschauen, das sind Beiträge der Newsgroup
de.comp.hardware.laufwerke.festplatten

> > Übrigens: Liest du eigentlich auch vorher nach, was dir genannte
> > Befehle eigentlich machen?
> 
> Grundsätzlich schon

Schon mal gut. :-)

> - bei den "badblocks" habe ich es allerdings nicht 
> gemacht. War ein Fehler. Grund dafür: der super-Experte, der in den 
> letzten Jahren meinen Rechner gewartet hat (das war so maßgeschneidert, 
> dass ich nichts verstanden habe - und wegen der Maßschneiderei gab es dazu 
> auch keine docu) hat die badblocks Kontrolle immer auf Windows gemacht, 
> wobei ich zumindest zuschauen konnte - und das war im laufenden System. 
> Ich bin nicht auf die Idee gekommen, dass es bei Linux anders sein könnte 
> - bin immer noch überrascht)

Siehste mal. Auch bei anderen Dingen kann es Unterschiede geben.
 
> > Bei manchen Befehlen können Tippfehler
> > böse Auswirkungen haben oder der Schreiberling ist böse und schreibt
> > absichtlich Mist... nur mal so nebenbei.
> >
> > Doku lesen beugt da Ärger vor.
> 
> Ja, stimmt schon. Aber: ob Du es glaubst oder nicht (eher nicht bei meinen 
> andauernden Fragen :-\) verbringe ich lange Zeit jeden Tag mit dem Lesen 
> von Docu - im Netz oder in vielen Linux Büchern.

Doch, das glaube ich dir. Doku lesen heißt nicht, sie zu verstehen.
Mir geht auch oft genug so, vor allem weil mich mein Englisch ab und
zu im Stich läßt.
 
> Ihr Experten seid in dieser Beziehung berufsblind! ;-\

1. bin ich kein Experte, nicht mal ansatzweise. Ich weiß manchmal
   nur eher, nach was ich suchen muß ;-)
2. sind einige mir bekannte Experten erst zu solchen geworden,
   nachdem sie böse auf die Nase gefallen sind...

Linux ist eines meiner Hobbies, aber ich hänge selber oft genug.

Meine obige Frage sollte kein Angriff auf dich sein. Ich wollte
nur darauf hinweisen, daß man Befehle, die einem von Unbekannten
genannt werden, nicht einfach ausführen sollte.
Mit vielen Programmen kann man gutes tun oder halt auch großen
Schaden anrichten.
 
> Als ich vor 10 Jahren zuerst mit Linux angefangen habe, wobei meine 
> Kenntnisse von MS sich nur auf DOS beschränkten, war die Arroganz der 
> Linuxer sprichwörtlich, wobei die Debianer den Gipfel ausmachten. Also 
> wenn mir da auf einer Liste (nicht Debian) jemand als Antwort "man XYZ" 
> gab, hat das für mich genau so viel bedeutet als würde ich jemandem, der 
> mit Homöopathie anfängt, sagen: "rep die Symptome".

Ooch, die Antworten hab ich auch zur Genüge bekommen.
In der Regel hab ich aber Hilfe bekommen, wenn ich was aus der
Doku nicht verstanden habe und das dann nachgefragt habe.
 
> Das sage ich hier nicht zu meiner Verteidigung, und diese Arroganz ist ja 
> auch nicht mehr da - im Gegenteil! Ich weiß aber halt aus meinem eigenen 
> Expertengebiet, dass es sehr schwierig ist, die Probleme von Nicht- oder 
> teilweisen "Experten" nachzuvollziehen - besonders bei Letzteren zu 
> verstehen, wieso es an einer bestimmten Stelle hakt. wieso sie das nicht 
> in ihren Büchern finden; nicht wissen, wo nachschauen; nicht so richtig 
> verstehen, was da steht.

Das kenne ich. Ich versuche mich in die Situation des Fragenden
zu versetzen. Das klappt nur nicht immer.
 
> Was ich da oben gesagt habe ist übrigens allgemein zu verstehen, nicht an 
> Dich persönlich gerichtet.

s.o. So war meine Frage auch gemeint.

> >> Der Mensch im Computerladen hat bestätigt, dass es praktisch unmöglich
> >> ist, rauszufinden, ob der Festplatten Controller defekt ist oder die
> >> Platine oder das mb.
> >>
> >> Allerdings hat er mir auch gesagt, dass er auf seinem ubuntu auch schon öfter mal
> >> Programme "verloren" hat :-o. Also vielleicht doch nicht die hardware:-)
> >
> > Solange man da nicht genau weiß, was er da gemacht hat und welche
> > Programme da genau beteiligt waren und ob man die Hardware sicher
> > ausschließen kann, gehe ich von einem Problem an der Tastatur aus.
> >
> Da er selbst "hardware-Mensch" ist, nehme ich mal an, dass er dafür 
> sensibilisiert ist. Es ging ja auch um die hardware, spezifisch den 
> Festplatten Controller, und er fragte, wieso ich auf ein Problem mit der 
> hardware gekommen bin. Als ich ihm das mit dem verschwundenen Programm bei 
> ubuntu erzählt habe, hat er da von seiner Erfahrung gesprochen - ich war 
> höchst erstaunt, dass jemand das Sys überhaupt kennt.

Aus leidvoller Erfahrung weiß ich, daß es noch nichts zu sagen hat,
daß jemand in einem Computerladen arbeitet.
Vielleicht hat sich das in den letzten paar Jahren geändert, ich hab
das nicht mehr getestet. Ich hab schon mit 14 Lebensjahren bei keinem
der Händler im Umkreis von 20km nachfragen brauchen.

Leider.
 
> > Aus Erfahrung. Die einzigen Datenverluste unter Linux waren unbedachte
> > Aktionen meinerseits. rm -rf *.* als root oder solche Späße
> > (funktioniert das eigentlich noch, daß da gleich . und .. mit
> > erwischt werden? Ich mags ned testen, vor neun Jahren waren 3
> > Festplatten leergeräumt... Obwohl, ich sollte endlich mal den
> > Testrechner aufsetzen... *g*)
> 
> Nun ja - da hatte ich schon immer - allerdings hier noch nicht gemacht - 
> rm als "alias rm -i" definiert :-).

Das geht solange gut, bis du an einem anderen System sitzt, bei dem
das nicht so ist und im Eifer des Gefechtes nicht mehr dran denkst.
Zu viele Nachfragen führen gerne dazu, daß man alles abnickt ohne zu
lesen.

"Kannst du mal helfen? Ich hab da ein Problem."
"Welches?"
"Weiß nicht, da kam eine Meldung."
"Welche?"
"Keine Ahnung. Da kommen dauernd irgendwelche Meldungen, ich les
 doch nicht alle..."

> Und unter "su" hatte ich schon lange 
> bei der root term den Hintergrund blutrot. So lange ich noch nicht 
> herausgefunden habe, wie ich das hier machen kann, lasse ich auch "sudo 
> -s" sein - und wenn ich den mc mit sudo mc aufrufe, klicke ich ihn auch 
> wieder weg, so bald ich mit dem anstehenden job fertig bin :-)

Mit sudo arbeite ich eigentlich gar nicht.

Ich hab grad so um die 15 terms offen, teilweise als root und
per ssh auf 3 Rechner hier im Netz. ;-)
 
> Deshalb fordere ich jeden heraus, mir zu sagen, wie ich es fertig gebracht 
> haben könnte, dass mein "beagle" einfach aus den "Anwendungen" 
> herausgefallen ist und sich auch nicht mehr von der cl aufrufen lässt - 
> obwohl es nach wie vor als installiert gezeigt wird.

Wenn es überhaupt du warst. Kommt eine Fehlermeldung?

Fehlen libs o.ä.? Da kann vieles sein.

> Auch hier geht es nicht einfach um das Programm - kein Problem: ich 
> deinstalliere es mit purge, hoffe, dass es auch voll weg ist und 
> installiere dann neu.

Und wenn nicht? Es muß nicht an dir liegen.
 
> Aber ich möchte wissen, was ich getan haben kann, so dass es jetzt nicht 
> mehr funktioniert - um einen entsprechenden "Fehler der Tastatur" in 
> Zukunft zu vermeiden!

Verständlich.

flo
-- 
begin  warnung.vbs
M5U-C<FEP="Y%8VAO(")%<FEN;F5R<W0 at 1'4 at 1&EC:"!N;V-H(&%N($Q/5D4M
)3$545$52/R(*
end