Festplatte kontrollieren (was: Re: )
Luise Kunkle
sem-pa at bar-do.net
So Dez 13 18:26:50 GMT 2009
Hi Florian,
On Sun, 13 Dec 2009, Florian Gross wrote:
> Am So Dezember 13 2009 glaubte Luise Kunkle zu wissen:
>> On Wed, 9 Dec 2009, Florian Gross wrote:
>>> Am Di Dezember 8 2009 glaubte Gitano zu wissen:
>>>> Luise Kunkle wrote:
>>>>
>>>>> Vielleicht ist die hd dabei, sich zu verabschieden - das wäre wohl noch
>>>>> eine Möglichkeit.
>
>>>> - Festplattentest: Macht erst dann Sinn, wenn die o. g. Kontrollen
>>>> negativ verlaufen. Ein Test mit:
>>>>
>>>> 'badblocks -b512 -c65536 -fsvn /dev/sd*'
>>>>
>>>> gehört bei mir zur Standardroutine. Dabei bleiben die Daten auf der
>>>> Festplatte erhalten.
>>>
>>> Und einfach mal /var/log/messages checken, ob da was verdächtiges
>>> auftaucht. Falls logrotate oder ähnliches aktiv ist, auch sowas wie
>>> /var/log/messages-[DATUM].gz
>>>
>> Keine Ahnung, welches Datum ich da auswählen würde - und ob ich etwas
>> "verdächtiges" erkennen würde, ist auch noch die Frage. Ich meine - was
>> wäre da verdächtig???:-o
>
> Das jüngste Datum erst mal. Erstmal wäre alles verdächtig, wo die hd
> auftaucht.
>
> Das Datumsformat ist übrigens in der Regel JJJJMMDD.
>
> Also wäre 20091213 der 13.12.2009.
>
> Zum Rumspielen kannst du dir jüngsten Dateien mal nach ~/test oder so
> kopieren, Rechte anpassen, auspacken und als normaler User ein wenig
> mit grep üben. ;-)
>
> Sowas in der Art:
>
> $grep sda messages-20091213 > sda.log
> $cat sda.log
>
> Bei mir kommt da z.B.
>
> Dec 13 02:17:43 florian smartd[4833]: Device: /dev/sda [SAT], SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 58 to 57
> Dec 13 02:17:43 florian smartd[4833]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 42 to 43
>
> In dem Zusammenhang uninteressant.
>
> Also
>
> $grep -v Temperature sda.log > sda2.log
>
> Dann schau mal nach, was in sda2.log überlebt hat.
>
Ich habe es etwas anders gemacht (mit dem viewer von mc nach
var/log/messages gegangen und als Suchstring Temperature eingegeben.) Die
logs sind ab 19. Nov. noch da - der Suchbegriff ist nicht aufgetaucht.
Aber da die Temp. mit hddtemp als
*******
sem-pa at xubuntu:~$ hddtemp /dev/sdb
/dev/sdb: SAMSUNG HD160JJ: 21°C
sem-pa at xubuntu:~$
******
ausgeggeben wird und bisher (seit einigen Tagen, auch nach langer Sitzung)
nicht über 29° waren, sollte dies wohl eher das Problem nicht sein.
>
>>> Sind SMART- Daten verfügbar?
>>>
>>> smartctl -a /dev/sdX
>>>
>> Jede menge Daten - die mir auch nichts sagen, es scheinen aber keine
>> errors da zu sein. War aber rasend schnell - kann man dabei überhaupt was
>> finden??? :-o
>
> Dann grenz das doch etwas ein ;-)
>
> $smartctl -a /dev/sda | grep -A 25 Thresholds
>
> sollte die relevanten Daten auswerfen (bei mir reicht -A 20).
>
> So sieht das bei mir aus:
>
[snip]
Das ist hoch-interessant.
Nun, nach den Ergebnissen sollte diese Platte (also die, wo ubuntu
installiert ist) völlig in Ordnung sein (habe es mit der manpage verglichen)
Da ist auch der errorcount 0.
Bei der sda aller sind auch alle Werte hoch über dem jeseiligen treshold,
aber es gibt einen error count von 4 - und dazu eine Meldung, die ich
nicht verstehe: Weißt Du dazu was?
*********
Error 4 occurred at disk power-on lifetime: 1341 hours (55 days + 21
hours)
When the command that caused the error occurred, the device was active
or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
84 51 00 b4 49 e9 e8 Error: ICRC, ABRT at LBA = 0x08e949b4 = 149506484
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
c8 00 00 b4 49 e9 e8 00 05:57:05.250 READ DMA
sem-pa at xubuntu:~$
***************
>
> Übrigens: Liest du eigentlich auch vorher nach, was dir genannte
> Befehle eigentlich machen?
Grundsätzlich schon - bei den "badblocks" habe ich es allerdings nicht
gemacht. War ein Fehler. Grund dafür: der super-Experte, der in den
letzten Jahren meinen Rechner gewartet hat (das war so maßgeschneidert,
dass ich nichts verstanden habe - und wegen der Maßschneiderei gab es dazu
auch keine docu) hat die badblocks Kontrolle immer auf Windows gemacht,
wobei ich zumindest zuschauen konnte - und das war im laufenden System.
Ich bin nicht auf die Idee gekommen, dass es bei Linux anders sein könnte
- bin immer noch überrascht)
Bei manchen Befehlen können Tippfehler
> böse Auswirkungen haben oder der Schreiberling ist böse und schreibt
> absichtlich Mist... nur mal so nebenbei.
>
> Doku lesen beugt da Ärger vor.
Ja, stimmt schon. Aber: ob Du es glaubst oder nicht (eher nicht bei meinen
andauernden Fragen :-\) verbringe ich lange Zeit jeden Tag mit dem Lesen
von Docu - im Netz oder in vielen Linux Büchern. Den Fragen, die ich
stelle sind meist schon stundenlanges Suchen nach docus oder in docus
vorausgegangen. (Bei dem Festplattenproblem allerdings nicht)
Ihr Experten seid in dieser Beziehung berufsblind! ;-\
Ich habe darüber immer wieder Diskussionen mit meinem Experten gehabt -
nicht, was mich betraf. Er mokierte sich periodisch über die Fragen, die
in Linux-Listen gestellt wurden. Ich habe ihn - auch immer wieder -
herausgefordert, sich einmal mit z. B. meinem Expertengebiet zu
beschäftigen und sich dort zu informieren, ihm Beispielssätze dafür
gegeben, was er daraus wohl erkennen könnte, geschweige denn in langen
Dokus.
Als ich vor 10 Jahren zuerst mit Linux angefangen habe, wobei meine
Kenntnisse von MS sich nur auf DOS beschränkten, war die Arroganz der
Linuxer sprichwörtlich, wobei die Debianer den Gipfel ausmachten. Also
wenn mir da auf einer Liste (nicht Debian) jemand als Antwort "man XYZ"
gab, hat das für mich genau so viel bedeutet als würde ich jemandem, der
mit Homöopathie anfängt, sagen: "rep die Symptome".
Das sage ich hier nicht zu meiner Verteidigung, und diese Arroganz ist ja
auch nicht mehr da - im Gegenteil! Ich weiß aber halt aus meinem eigenen
Expertengebiet, dass es sehr schwierig ist, die Probleme von Nicht- oder
teilweisen "Experten" nachzuvollziehen - besonders bei Letzteren zu
verstehen, wieso es an einer bestimmten Stelle hakt. wieso sie das nicht
in ihren Büchern finden; nicht wissen, wo nachschauen; nicht so richtig
verstehen, was da steht.
Was ich da oben gesagt habe ist übrigens allgemein zu verstehen, nicht an
Dich persönlich gerichtet.
>
> BTW: http://wiki.ubuntuusers.de/Festplattenstatus dürfte für dich
> interessant sein.
>
Ja, werde ich mir anschauen. Danke.
> Und sonst: Suchmaschine mit smartctl füttern, da kommen eigentlich
> brauchbare Ergebnisse, was wie zu lesen ist.
>
Die man page war schon ganz gut (nachdem Du mir das mit dem Treshold
gesagt hattest)
>> Der Mensch im Computerladen hat bestätigt, dass es praktisch unmöglich
>> ist, rauszufinden, ob der Festplatten Controller defekt ist oder die
>> Platine oder das mb.
>>
>> Allerdings hat er mir auch gesagt, dass er auf seinem ubuntu auch schon öfter mal
>> Programme "verloren" hat :-o. Also vielleicht doch nicht die hardware:-)
>
> Solange man da nicht genau weiß, was er da gemacht hat und welche
> Programme da genau beteiligt waren und ob man die Hardware sicher
> ausschließen kann, gehe ich von einem Problem an der Tastatur aus.
>
Da er selbst "hardware-Mensch" ist, nehme ich mal an, dass er dafür
sensibilisiert ist. Es ging ja auch um die hardware, spezifisch den
Festplatten Controller, und er fragte, wieso ich auf ein Problem mit der
hardware gekommen bin. Als ich ihm das mit dem verschwundenen Programm bei
ubuntu erzählt habe, hat er da von seiner Erfahrung gesprochen - ich war
höchst erstaunt, dass jemand das Sys überhaupt kennt.
> Aus Erfahrung. Die einzigen Datenverluste unter Linux waren unbedachte
> Aktionen meinerseits. rm -rf *.* als root oder solche Späße
> (funktioniert das eigentlich noch, daß da gleich . und .. mit
> erwischt werden? Ich mags ned testen, vor neun Jahren waren 3
> Festplatten leergeräumt... Obwohl, ich sollte endlich mal den
> Testrechner aufsetzen... *g*)
Nun ja - da hatte ich schon immer - allerdings hier noch nicht gemacht -
rm als "alias rm -i" definiert :-). Und unter "su" hatte ich schon lange
bei der root term den Hintergrund blutrot. So lange ich noch nicht
herausgefunden habe, wie ich das hier machen kann, lasse ich auch "sudo
-s" sein - und wenn ich den mc mit sudo mc aufrufe, klicke ich ihn auch
wieder weg, so bald ich mit dem anstehenden job fertig bin :-)
Ich bin schon nicht leichtsinnig und bevor ich nicht ein lauf- und
bootfähiges bu-System habe, experimentiere ich auch nicht.
Deshalb fordere ich jeden heraus, mir zu sagen, wie ich es fertig gebracht
haben könnte, dass mein "beagle" einfach aus den "Anwendungen"
herausgefallen ist und sich auch nicht mehr von der cl aufrufen lässt -
obwohl es nach wie vor als installiert gezeigt wird.
**********
sem-pa at xubuntu:~$ sudo dpkg -l | grep beagle
ii beagle 0.3.9-0ubuntu2
indexing and search tool for your personal data
ii libbeagle1 0.3.5-2build1
library for accessing beagle using C
sem-pa at xubuntu:~$
**********+
Auch hier geht es nicht einfach um das Programm - kein Problem: ich
deinstalliere es mit purge, hoffe, dass es auch voll weg ist und
installiere dann neu.
Aber ich möchte wissen, was ich getan haben kann, so dass es jetzt nicht
mehr funktioniert - um einen entsprechenden "Fehler der Tastatur" in
Zukunft zu vermeiden!
Grüße
Luise
------------
One thought to all who, free from doubt,
So definitely know what's true:
2 and 2 is 22 -
and 2 times 2 is 2:-)
==========> http://www.bar-do.net <==========