The Debian User Group in Vienna

Text archives Help


[Debienna] SATA Port / HDD Probleme


Chronological Thread 
  • From: Sebastian Bachmann <me AT free-minds.net>
  • To: debienna AT lists.debienna.at
  • Subject: [Debienna] SATA Port / HDD Probleme
  • Date: Sat, 03 Oct 2015 21:09:13 +0200
  • List-archive: <http://lists.debienna.at/pipermail/debienna/>
  • List-id: The Debian User Group in Vienna <debienna.lists.debienna.at>

Hi!
Ich hab einen Server der als NAS fungiert. Dort ist vor kurzem die Root
Platte kaputt gegangen (kein Wunder, die war auch schon sehr alt und
eine alte Notebookplatte...). Die habe ich jetzt gegen eine SSD
getauscht und Debian neu aufgesetzt. Jetzt sehe ich im Syslog immer
wieder diese Logs:

[ 3153.188731] ata3.00: exception Emask 0x10 SAct 0x400000 SErr 0x400000
action 0x6 frozen
[ 3153.188919] ata3.00: irq_stat 0x08000000, interface fatal error
[ 3153.189038] ata3: SError: { Handshk }
[ 3153.189120] ata3.00: failed command: WRITE FPDMA QUEUED
[ 3153.189238] ata3.00: cmd 61/00:b0:00:8c:97/04:00:7d:00:00/40 tag 22
ncq 524288 out
res 40/00:b4:00:8c:97/00:00:7d:00:00/40 Emask 0x10 (ATA bus error)
[ 3153.189533] ata3.00: status: { DRDY }
[ 3153.189616] ata3: hard resetting link
[ 3153.680643] ata3: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
[ 3153.683905] ata3.00: configured for UDMA/133
[ 3153.683972] ata3: EH complete

Auf ata3 ist /dev/sdc, die schaut aber imo sehr gut aus:
http://files.reox.at/paste/smartctl_2015-10-03.txt

Wenn ich nach dem Fehler suche (irq_stat 0x08000000, interface fatal
error) finde ich genau die Frage die ich auch habe: "Geht die Platte
gerade kaputt".
Es könnte ja sein, dass alle Platten oder sogar das Board etwas
abbekommen haben und deshalb schlapp machen... Eine weitere Platte hat
heute im smartd test einen "Offline uncorrectable sectors"
(http://files.reox.at/paste/smartctl_sda_2015-10-03.txt) gemeldet. Afaik
ist das noch nicht das volle Drama, da ja normalerweise Sektoren dafür
frei sind. Auf der Platte rennt ein mirrored LVM, einen RAID check hab
ich gerade mal manuell angeworfen.

Ich habe derzeit keinen physischen Zugriff auf die Maschine, gibt es evt
irgendetwas was ich remote testen kann? Sobald ich vor Ort bin wären
folgende Dinge geplant:
* Platten umstecken und schauen ob es an der Platte oder am Port liegt
* ggf Kabel tauschen

Danke und LG
Sebastian




Archive powered by MHonArc 2.6.18.

Top of page