Nvidia 550 kernel panic Manjaero Arch Linux

Драйвер Nvidia 550 ломает стабильность системы Manjaro/Arch Linux

В крайнее время я стал замечать, что ноут (ASUS TUF Gaming A15, если кому надо) под управлением Manjaro Linux начал вести себя довольно нестабильно. Постоянные зависоны, сбои, тормоза я ещё как-то терпел, но когда ядро мне выкатило kernel panic – я понял, что нужно что-то делать. Конечно, вначале я проверил железо: прогнал память Memtest’ом, смотрел S.M.A.R.T. NVMe’шки, сжимал многогиговые архивы и проверял их на корректность, и т.д. Никаких проблем выявлено не было. Более того, на live-линуксах с флешки всё работало без проблем! Это подтолкнуло меня к мысли, что что-то сломалось в самой системе, а значит её нужно переустановить. Забэкапив все нужные данные, я решил накатить новенькую, чистую ОС.

Выбор пал ради разнообразия на EndeavourOS. Бут с флешки – установка – запуск, всё прошло как обычно без проблем. Во время установки был выбран проприетарный видеодрайвер Nvidia. Каково же было моё удивление, когда во время установки софта на чистую систему я снова начал ловить те же самые глюки, что были на старой Manjaro! Закончив офигивать, я полез искать решение проблемы в интернеты. В русскоязычном сегменте ничего похожего на свою проблему я не нашёл, что ещё больше убедило меня в том, что проблема всё-таки может быть в железе. Чистый дистр же выкатывает глюки! Но, решив не падать духом раньше времени, полез искать по англоязычной части сети, и… нашёл то что искал.

Проблема

Объяснение и решение проблемы нашлось в одном из тредов на форуме Arch Linux. Пользователь с ником mesaprotector написал следующий пост (машинный перевод на русский):

Это действительно похоже на обновление, которое вызвало проблемы. Обратите внимание на упоминания ошибок, связанных с разыменованием нулевого указателя в Linux. Похоже, Nvidia попыталась исправить некоторые уязвимости и вместо этого сломала многое.

(Я переключился на nvidia-open, но если это не поможет, я думаю, что я могу вернуться к версии 545 и оставаться там навсегда, ха-ха. К счастью, я не играю на Linux, поэтому обновленные драйверы не являются обязательными.)

mesaprotector

Конечно же, после этого я сразу понял что нужно делать – и проблема была решена! Так же стало понятно, почему у меня сыпало глюками на новой системе – злое… счастный проприетарный драйвер был установлен ещё в процессе установки самого дистрибутива на ноут! Nvidia, луч органики тебе в лицо за это! 🤬 А пользователю mesaprotector большое спасибо за подсказку 🤝

Решение проблемы

Теперь ясно что делать. Нужно удалить глючный драйвер Nvidia 550 и либо перейти на open-source драйвер Nouveau, либо установить видеодрайвер предыдущей версии. Т.к. в работе мне нужно GPU ускорение, я выбрал второй вариант: драйвер предыдущей версии.

В AUR лежит видеодрайвер Nvidia 535 версии, его и ставим с помощью любого AUR-хелпера:

yay -S nvidia-535xx-dkms nvidia-535xx-utils opencl-nvidia-535xx

Для тех, кому нужны дополнительно 32-битные варианты (например, для запуска некоторых игр), добавляем их в список установки:

yay -S nvidia-535xx-dkms nvidia-535xx-utils opencl-nvidia-535xx lib32-nvidia-535xx-utils lib32-opencl-nvidia-535xx

Дожидаемся завершения установки, перезагружаемся. Можно пользоваться стабильной системой пока Nvidia пытается отловить и пофиксить баг в своём крайнем драйвере.

Ждём от Невидии исправления этого позора 😒

Дополнение 07.05.2024

Обновления глючного драйвера версии 550.78-1 всё ещё нет. Пользователи высмеивают Nvidia.

Пользователи высмеивают Nvidia

Обсуждение на форуме разработчиков здесь.