Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » В помощь системному администратору » RAID-контроллер RS2BL040

Модерирует : lynx, Crash_Master, dg, emx, ShriEkeR

 Версия для печати • ПодписатьсяДобавить в закладки

Открыть новую тему     Написать ответ в эту тему

Atmel

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Приветствую.
На предприятии есть терминальный сервер 2008 с аппаратным RAID 10 на RS2BL040.
На логическом диске и ОС, и раздел с данными.
После первичной установки через три года отказал  диск на четвертом канале.  
Замена помогла примерно на год. После этого опять отказывает замененный физический диск.
Этот по словам старожила тоже проработал только год. Замена. Винчестеры на замену подбирались с аналогичными параметрами буфера и т.д.
Настал черед последнего, и тоже на этом канале.
Повисла ОСь - стали звонить сотрудники.  После перезагрузки увидели диск в оффлайне, после включения - ребилдинг.
Через сутки снова повисла ОСь, решить проблему позволила только замена диска.
 
 
Этот последний отказавший я подверг сканированию под ДОС, mhdd показало хорошие результаты (четыре сектора warning , которые относились к <500, не в счет), SMART тоже хороший весь.
Отсюда я не понимаю, чего не нравится контроллеру в этом диске?
 
ПС.
Материнка не подскажу сейчас какая, если это надо, то уточню.

Всего записей: 127 | Зарегистр. 10-04-2012 | Отправлено: 18:21 20-05-2019
Paromshick



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Шлейф

----------
Скучно

Всего записей: 3019 | Зарегистр. 12-04-2013 | Отправлено: 20:16 20-05-2019
Atmel

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Похоже. После перезагрузки произошло без замены диска, а с заменой разъем на стороне винчестера передернули, контакт улучшился. Возможно, дело в этом.
А так, найти такой шлейф можно теперь только на барахолке? Или они универсальные и подходят от современных контроллеров от Интел?  
 
Добавлено:
И мне вот непонятно, чеж так операционка-от глючит, ведь десятка райд, второй диск в работе, массивы не разрушены, логический диск рабочий?

Всего записей: 127 | Зарегистр. 10-04-2012 | Отправлено: 21:44 20-05-2019
Paromshick



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Электроника по сути - наука о контактах. Спирт вам в помощь. Шлейф на замену. или промывку. Доведут технику до гроздьев пыли... Зря вы думаете, что наличие/отсутствие экспандера и модели HDD не имеют никакого значения.
Прошейте контроллер.
Всё - не спеша. Пришел пораньше, разобрал собрал. Как АК. День отстрелялся и обслужил уже по полной.
Ну или как-то так.

----------
Скучно

Всего записей: 3019 | Зарегистр. 12-04-2013 | Отправлено: 21:56 20-05-2019 | Исправлено: Paromshick, 21:57 20-05-2019
Atmel

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ну, пыли там нет. Прошивка последняя. И все-таки остается вопрос о неполной, скажем так, работоспособности логического диска в 1+0 при вылете одного физического диска в зеркале.

Всего записей: 127 | Зарегистр. 10-04-2012 | Отправлено: 22:56 20-05-2019
Paromshick



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Если диск в оффлайн выходит, какая может быть работоспособность. Почему он туда вылетает из-за одного лишь диска, надо бы посмотреть логи контролера, для этого нужно ставить софт типа Intel RWC2. или LSI MR... Там много шильдиков разных, суть же одна. Если я правильно понял ваш контроллер, конечно.

----------
Скучно

Всего записей: 3019 | Зарегистр. 12-04-2013 | Отправлено: 06:44 21-05-2019
igor me v2

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Причём косяк может быть как в шлейфе данных, так и в питании (и это, думается, даже более вероятно, ибо в случае косяка со шлейфом данных в SMART бы отразилось...). У меня было разок из-за питания, отходившего MOLEX-SATA переходника.
 
Добавлено:
А, хотя это SAS и по идее там шлейф спаренный. Ну в общем шлейф, весь, проверять...

Всего записей: 7213 | Зарегистр. 27-03-2016 | Отправлено: 19:35 21-05-2019
Atmel

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Да, забыл написать, что питальники меняли.
В логах множество записей типа
 
ID = 113
SEQUENCE NUMBER = 58922
TIME = 20-05-2019 20:18:55
LOCALIZED MESSAGE = Controller ID:  0   Unexpected sense:   PD       =   Port 0 - 3:0:2Invalid field in CDB,   CDB   =    0x1a 0x08 0x00 0x00 0xff 0x00    ,   Sense   =    0x70 0x00 0x05 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x24 0x00 0x00 0x00 0x00 0x00
 
ID = 113
SEQUENCE NUMBER = 58923
TIME = 20-05-2019 20:18:57
LOCALIZED MESSAGE = Controller ID:  0   Unexpected sense:   PD       =   Port 0 - 3:0:2Power on, reset, or bus device reset occurred,   CDB   =    0x2a 0x00 0x07 0x36 0x6d 0x6b 0x00 0x00 0x0d 0x00    ,   Sense   =    0x70 0x00 0x06 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x29 0x00 0x00 0x00 0x00 0x00
 
ID = 113
SEQUENCE NUMBER = 58316
TIME = 20-05-2019 04:36:42
LOCALIZED MESSAGE = Controller ID:  0   Unexpected sense:   PD       =   Port 0 - 3:0:2Invalid field in CDB,   CDB   =    0x1a 0x08 0x00 0x00 0xff 0x00    ,   Sense   =    0x70 0x00 0x05 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x24 0x00 0x00 0x00 0x00 0x00
 
По спецификации SCSI ASC/ASCQ Assignments формата записи, это весьма многозначительная ошибка 6 29 0 Unit Attention - POR or device reset occurred ( где POR - "Power on, reset, or bus device reset occurred"), которая сопровождается, как я понял, ошибкой записи в любое блочное устройство.
 
В логе почему-то преимущественно упоминается Port 0 - 3:0:2 , последняя цифра, это канал физического диска. У нас выпадает на канале 3 (т.е. четвертый диск). Встречались раньше также 3:0:0 и 3:0:1
 
И еще, у нас SATAшные диски.
 
Вчера ночью в 20:18 сервер каким-то образом сам собой выключился. Причем в логах винды ни малейших следов выключения пользователем или программой/системой.
Указанные сообщения сыпятся с
18-05-2019 05:29:09
по
20-05-2019 20:18:57
когда сервер резко выключился.
После включения в 6 утра до сих пор в логах контроллера все хорошо.
 
Шлейф нашли. Надо дотянуть до ночи с четверга на пятницу, когда у нашего  сотрудника ИТ по предприятию ночное дежурство. Тогда и поменяем.

Всего записей: 127 | Зарегистр. 10-04-2012 | Отправлено: 20:45 21-05-2019 | Исправлено: Atmel, 21:21 21-05-2019
Paromshick



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
дотянуть до ночи с четверга на пятницу
Хм. Интересные вы люди. Бэкапы-то хоть есть?
Массага всем: Внимание! Сегодня с 13 (время обеда) до 14 на срочные профилактические работы будут остановлены сервисы 1С, файлообмен, почта, и интернет. Приносим свои. Благодарим за.
Естественно, обрисовать по начальству критичность положения и то, что НЕ ФАКТ что дело в шелйфе, но данные потерять реально.
 
 
Добавлено:
Видимо, когда следуют множественные ошибки, контроллер выводит диск в оффлайн. Должна быть соотв. запись.

----------
Скучно

Всего записей: 3019 | Зарегистр. 12-04-2013 | Отправлено: 21:33 21-05-2019
Открыть новую тему     Написать ответ в эту тему

Компьютерный форум Ru.Board » Компьютеры » В помощь системному администратору » RAID-контроллер RS2BL040


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru