Hässliche Fehlersuche

Heute gab es mal einen hässlichen Fehler bei einem Linux-Rechner: Beim kopieren vieler Dateien per NFS wurde das Netzwerk immer langsamer, bis schließlich das gesamte X11 „stand“, weil das Home natürlich auch per NFS kam.

Die Fehlersuche war etwas aufwendig, vor allem, weil ich am falschen „Ende“ angefangen habe zu suchen. Also zuerst NFS Client / Server, Portmapper, iptables, etc. geprüft (und natürlich nichts „ungewöhnliches“ gefunden). Da sich der Fehler nur beim Kopieren größerer Datenmengen reproduzieren ließ, war das Ganze entwas nervig. Irgendwann bin ich dann bis zur TCP-Ebene gekommen, und habe da mittels netstat festgestellt, das ein Haufen Pakete in der Sendewarteschlange stehen. Temporäres erhöhen von tcp_*mem sorgte dann kurzzeitig auch für das Puffern weiterer Daten, daher war nun sicher, das die Pakete nicht raus gingen (komischerweise funktionierte das Netzwerk ansonsten aber…). Im ifconfig aber keine Errors:0. Komisch.
Bei der Gegenprobe mit einer anderen Netzwerkkarte funktionierte natürlich alles.
Hätte man auch zuerst prüfen können 🙁

Googlen nach einem anderen als dem mitgelieferten Treiber für die Attansic L1 Karte brachte jetzt auch einen neueren Treiber als den mitgelieferten zu Tage. Und was steht da im Changelog:

0.1.40.3/VA0020
1. Fix the bug that network stall when mount NFS folder.

Morgen mal probieren, ob es mit dem neuen Treiber geht….

Update: Leider geht es damit auch nicht 🙁

Update^2: ethtool -K ethX tso off geht

Dieser Beitrag wurde unter Hardware, Linux, Software, Uni veröffentlicht. Setze ein Lesezeichen auf den Permalink.

1 Antwort zu Hässliche Fehlersuche

  1. js sagt:

    Probier mal die Attansic L1 Treiber, die es auf Sourceforge gibt. Die von Asus sind n bissl alt und unzuverlässig.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.