digit
16.01.2003, 12:19
На М61С на дисплее одного из процессоров появились сообщения SYS700 2 и SYS706 0.
Горят два красных индикатора на карте СР
При запросе статуса в LD135 выдает
cp 1 15 DSBL: 'NOT RESPONDING' .
Потытки перезагрузки системы в любом режиме ни к чему не приводят?
Помогите!!

RXL
16.01.2003, 14:56
SYS700 2
This message indicates self-test results, and call processing status. xx refers to appended numbers that follow the SYS700 message itself. Each set of numbers is associated with a specific call processing or self-test activity. They appear as the activity takes place.
02 = ROM created on {date}

SYS706 0
Software full reset, or software warm reset.
00 = Low level debugger command to warm start, or unexpected exception or interrupt occurred during early reset sequence.

Ни чего не понимаю, но чувствую что нужен рестарт. Возможно проблемы с железом.

Karter
16.01.2003, 15:30
Совершенно очевиден сбой одного из процессоров, приведший к его отключению.
Возможно, он совсем неисправен.

Все работы легко проводятся без потери сервиса.
Надо:
1) перевести станцию в split mode, так чтобы активным оставался cp0 (предварительно проверив, что IOP/CMDU 0 - работает и активен);
2) встать на прямой CPSI port 1-го процессора;
3) перегрузить ТОЛЬКО cp1 (лучше всего вообще - вытащить / пауза 60 секунд / вставить).

Если он не прогружается - замена и/или ремонт.
Если грузится - то все Ок. Спокойно выводишь станцию из split'а, синхронизируешься и счастье наступает.
Но, во втором случае, все равно надо понять, что был за сбой. В целях избежания повторения проблемы. Ибо, на последних релизах, процессора частенько выключаются при критических софтовых проблемах.

Karter
16.01.2003, 15:34
Рестарт - полная перезагрузка системы?
Полная потеря сервиса?

Помочь может, но на двухпроцессорных машинах существуют значительно более гуманные процедуры...

RXL
16.01.2003, 19:15
Избыток сили порой заменяет недостаток знания ж)

digit
23.01.2003, 04:11
Вытаскивал карту неработающего процессора, делал рестарт системы, не помогло.
Лишь в конце перезагрузки на мониторе подключенном к порту неработающего СР1 получил сообщение-
CMB Bus error
CMB Access Failure
Что-бы это значило?

Karter
24.01.2003, 13:47
Не понятно.
Станцию сплитил?
Что подразумевается под "рестарт системы"?

digit
25.01.2003, 05:40
Да system is in split mode, делал Reset и Init.
No access to CMDU 1 due to split mode.
test scsi - CABL test failed; CMDU 1 No Access/
Кабеля резервного нет, резервных блоков СР и CMDU тоже нет, а останавливать станцию и выявлять какая карат не работает пока не дают, что делать?

Скиталец
25.01.2003, 15:32
Хорошо, иногда случается блокировка CMDU.
CMDU 1 можно попробовать достать разобрать и глянуть. Может кабель и не виноват.
И еще можно ли работать с 1 процессором через процессорный порт или нет. Какой это релиз. Может попробуй загрузиться с дискеты.
Пока

Karter
26.01.2003, 18:37
Останавливать станцию совуршенно не нужно.
Итак, пока есть время...

Split mode:
1) CP 0 - faceplate switch в main;
2) CNI core 1 - switch в dsbl;
3) CP 1 - main.
4) IOP/CMDU выключать надо только, если хочешь ВЫТАЩИТЬ эту плату (для остановки винта и прочих дисководов).

В таком режиме станция работает ТОЛЬКО с CP 0 и не видит процессорный комплект core 1. Никакие тесты с активной стороны, соответственно, не нужны. Теперь с CP 1 и IOP/CMDU 1 можно делать ВСЕ ЧТО ДУШЕ УГОДНО. На сервис НИЧЕГО не повлияет.
Далее: для возможности работы с core 1 необходимо встать на прямой CPSI порт CP 1. Ибо, все остальные TTY "живут" с активной core 0 стороной.
Вытаскиваешь CP 1 и (выключив) IOP/CMDU 1.
Ждешь минуту. Вставляешь платы обратно, включаешь IOP/CMDU 1, нажимаешь RST на CP 1.
Смотришь, проходит ли загрузка core 1 (т.е. sysload, ini...). Грузится может минут семь легко.
Если не проходит (циклические перезагрузки или зависание в процессе sysload) - выкладывай все, что вываливалось в порт.

Если загрузится,то производится выход из split:

1) Нажимешь RST на CP 1 и ждешь три секунды, либо ждешь появления SYS702 на ЖК дисплее CP 1;
2) CP 1 faceplate switch - в norm. CP 1 начнет синхронизацию оперативной памяти с CP 0. В порты активной стороны core 0 выйдет соответствующее сообщение (возможно - с задержкой в пару минут). Синхронизация может проходить минут пятнадцать. По окончании - в порты core 0 выведется соответствующее сообщение. CP 1 выйдет из split'а.
2) CNI на core 1 - включть;
3) CP 0 - в norm;
4) Станция выведена из сплита, за исключением IOP/CMDU 1. Т.е. процессоров в сисьеме два, а накопителей - один. Необходимо произвести синхронизацию данных на дисках. Core 0, LD 137, SYNC.
Синхронизация будет сопровождаться соответствующими сообщениями по портам активного core 0.

Все приведенные выше действия являются неотъемлемой частью процедур замены CPU, CMDU итд. итп. и подробнейшим образом описаны в документации.

Еще раз повтрю, если core 1 не грузится в "полной изоляции", то выложи логи процесса загрузки CP 1 полностью. Обычно, там все наглядно видно. Информации должно быть много. Главное - на CPSI попасть :-))))....

digit
10.02.2003, 02:06
Сделал все, как учили, не грузится СР1, лог процесса загрузки CP 1 прицепил.



11-51659-err.zip

Karter
10.02.2003, 16:07
98% - процессор под замену.
2% - слот.

Можно попытаться заменить SIMM'ы памяти самому. Есть некоторая вероятность того, что поможет.