shruslanp
07.11.2016, 18:13
Добрый день, форумчане,
Простой вопрос к Вам, из-за чего может произойти блокировка модуля DIUT2?
Ситуация следующая:
HiPath 4000 v6 r2.15 соединен двумя потоками (EuroISDN) через один модуль DIUT2 с медиантом. Всё прекрасно работало в течение года, но в один "прекрасный" момент перестало.
Программный рестарт потока, программный рестарт как отдельного периферийного модуля, горячая замена модуля на другой не помогало. Помогла перезагрузка всей полки с модулем (отключение по питанию).
DIS-SDSU:ALL,,PEN,PER3,1,2,14,0;
H500: AMO SDSU STARTED
LTG1 (PERIPHERY)
------
MOUNTING LOCATION MODULE NAME BDL BD(#=ACT) STATUS
------------------- LTG 1 --------------------- READY
-AP370013-----SG 1 LTU 2 --------------------- READY
P204.AP3 1.AP3 2.014 DIUT2-E1 A Q2226-X200 DEF/NL
CCT LINE STNO SI BUS TYPE
000 2039 PP NW UNACH/NL
MULTLINE 30 . . . . . . . . . . . . . .UNACH
000 NO CONN
001 NETWORK SUBUNIT . TMD CO ISDN UNACH/CP
(ALT_ROUT: N) (S2COD )
LINE: 2039 STNO: SI:
001 . . . . . . . . TMD CO ISDN UNACH/CP
002 NETWORK SUBUNIT . TMD CO ISDN UNACH/CP
(ALT_ROUT: N) (S2COD )
.....................................
START-HISTA:RTYPE=SEARCH;
H500: AMO HISTA STARTED
H1: 00001 ERROR MESSAGES FOUND
A9002 M5 N0866 NO ACT BPB NMCALARM MINOR ALARM OFF 16-10-30 21:25:05
ALARM CLASS:CENTRAL:005
ALARM NAME:CC RESTARTS
FORMAT:2C
AMO-HISTA-111 READ HTS HISTORY FILE
START COMPLETED;
<sta-hista;
STA-HISTA;
H500: AMO HISTA STARTED
+---------+-----+-----------+--------+-------------------------+
I ALARM I ABS I ALARM I ALARM I ALARM NAME I
I GROUP I I NUMBER I PRIO I I
+---------+-----+-----------+--------+-------------------------+
I SWU-PER I BPB I 000 I MAJOR I C-O-TRUNK/EXCH-LINE I
+---------+-----+-----------+--------+-------------------------+
AMO-HISTA-111 READ HTS HISTORY FILE
START COMPLETED;
Aleksey_V
08.11.2016, 07:26
Судя по статусу: блокирован из-за неисправности / не загружен.
А так я бы в LWPAR параметр QUAL глянул, он блокирует комплект на время заданное в QUAL1 и QUAL2 при наличии ошибок в потоке.
shruslanp
08.11.2016, 10:21
Aleksey_V,
+-----------------------------------------------------------------------+
| LOADWARE PARAMETERS CIRCUIT TYPE: DIUS2 SOURCE: DB BLOCK: 10 |
+-----------------------------------------------------------------------+
| LNTYPE = COPPER VERSION = S2 QUAL = OFF |
| MASTER = Y DCHAN1 = 16 DCHAN2 = 0 |
| PATTERN = D5H QUAL1 = 10 SEC. QUAL2 = 10 MIN. |
| SMD = Y PERMACT = Y FCBAB = DFH |
| CDG = N FIXEDTEI = 0 CNTRNR = 255 |
| TEIVERIF = N CRC4REP = N |
| DEV = INDEP |
| INFO = |
+-----------------------------------------------------------------------+
Но модуль был заблокирован более 10 часов...
OLD_Operator
08.11.2016, 11:54
А что показывает DIS-REFTA? Может там кроется ответ по стабильности синхронизации ?
shruslanp
08.11.2016, 12:14
DIS-REFTA;
H500: AMO REFTA STARTED
+-------------------------------------------------------------------------+
| R E F E R E N C E C L O C K C I R C U I T S |
+--------------+---------+----------+---+------+------+------+-----+------+
| PEN | MODULE | DEVICE |PRI|ERROR |BLOCK |SUPP. |READY|SRCGRP|
| | | | | | | |BUT | |
| | | | | | | |ASYN.| |
+--------------+---------+----------+---+------+------+------+-----+------+
| 1- 2- 14- 0 | DIUT2 | S2COD | 0| 0| N | | N | 1|
| 1- 2- 14- 1 | DIUT2 | S2COD | 0| 0| N | | N | 1|
| 1- 3- 6- 1 | DIUT2 | S2CONN | 0| 0| N | | N | 1|
| 1- 2- 1- 1 | DIUT2 | S2CONN | 87| 0| N | | N | 1|
| 1- 2- 1- 0 | DIUT2 | S2CONN | 88| 0| N | | N | 1|
| 1- 1- 14- 0 | DIUT2 | S2CONN | 89| 0| N | | N | 1|
| 1- 1- 14- 1 | DIUT2 | S2CONN | 90| 0| N | X| N | 1|
+--------------+---------+----------+---+------+------+------+-----+------+
Перидически проверяю, всегда по нулям. Даже по истечении 1 часа в день блокировки модуля потоки 1-2-14 были в нулях...
Для IP шлюза (медиант) это нормально.
Нужно было не рестартовать DIUT2, а рестартовать медиант.
А куда дальше после медианта идёт соединение?
shruslanp
08.11.2016, 14:44
Медиант рестартовали (по питанию) - не помогло.
Связки следующие:
1) HiPath 4000 E1 - E1 Mediant 1000 IP - IP Mediant 800 E1 - E1 Avaya Definity
2) HiPath 4000 E1 - E1 Mediant 1000 IP - IP Mediant 800 E1 - E1 DX500
А медиант рестартовали с обеих сторон, или только со стороны HiPath?
АТС, не важно HiPath или Avaya, в этой схеме не при чём.
Хотя, если с обеих сторон АТС включены как "мастер", могут быть нюансы.
shruslanp
08.11.2016, 16:46
Со стороны HiPath только медиант перезагружали. HiPath везде выступает мастером, dx500 и Avaya слейвом.
Также хочу заметить, что при команде dis-bcsu:tbl;
13 | Q2225-X SLMAE A 0| | Q2225-X | 1 -09 - | READY
14 | Q2226-X200 DIUT2-E1 1 A 0|*| UNKNOWN | | DEFECT
и после при смене модуля на горячую на другой рабочий идентичный DIUT2 без подключенных потоковых кабелей модуль уже не подымался и остался гореть красным.
Кто настраивал HiPath?
Когда был запущен в работу этот канал (через медиант)?
Полки включены в процессор штатными кабелями?
На 2-ой полке есть незанятые слоты?
Кто настраивал HiPath?
Ну я и...? ;)
Aleksey_V
09.11.2016, 08:04
Как то скромно ты ошибки нам показал, видно, что висела какая то аварийная сигнализация и когда она появилась не понятно, показывай тогда ошибки скажем за месяц до аварии.
Да, вопрос простой, все hotfix и loadware были установлены?
Да, вопрос простой, все hotfix и loadware были установлены?
Все сделано по фен шую. Сбоев никаких не наблюдается , да и вообщем не наблюдалось никогда, кроме последнего...
Для полноты картины покажите
STA-HISTA:SEARCH,2016-11-08/10:00,2016-11-08/11:00;
Дата и время начала здесь нужно указать немного раньше, чем предполагается
переход статуса платы в DEFECT. А конец через 1 час.
shruslanp
09.11.2016, 17:50
Благодарю, masviss. Причина проблемы вроде вскрылась, вышел из строя один из жесткий дисков. За 15 часов до обнаружения проблемы выявился инцидент с перезагрузкой станции. Дело было ночью в выходной день, поэтому этого никто и не заметил, и не доложил. Да и сами индикатор жесткого тоже не проверили: был скрыт за кабелем, соединяющим 2 процессора. "START-HISTA:RTYPE=SEARCH;" выдал то, что я описал в начале.
Станция битый диск заблокировала и в портале просит теперь скорее его заменить.
Ошибки, бывшие при загрузке станции:
F5413 E8 N0549 STATIST BPB CIRCUIT L2 SPOR ERROR 16-10-30 03:17:04
ALARM CLASS:SWU-PER:000
P204:LTG1 :LTU2 :014: 00 : 0 -- -- BST:-- PLS:----
FORMAT:22 DEVICE NAME: S2COD
0200010146FFFFFFFFFFFFFFFFFFFFFF FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF
FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF
FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF
FFFFFFFFFF
F5413 E8 N0550 STATIST BPB CIRCUIT L2 SPOR ERROR 16-10-30 03:17:04
ALARM CLASS:SWU-PER:000
P204:LTG1 :LTU2 :014: 01 : 0 -- -- BST:-- PLS:----
FORMAT:22 DEVICE NAME: S2COD
0200010146FFFFFFFFFFFFFFFFFFFFFF FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF
FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF
FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF
FFFFFFFFFF
F5413 E8 N0551 STATIST BPB CIRCUIT L2 SPOR ERROR 16-10-30 03:17:04
ALARM CLASS:SWU-PER:000
P204:LTG1 :LTU2 :014: 00 : 0 -- -- BST:-- PLS:----
...................
F5371 E8 N0762 TEMPLOCK BPB BOARD STAT OVERFLOW 16-10-30 03:17:08
ALARM CLASS:SWU-PER:000
P204:LTG1 :LTU2 :014: 00 : 0 -- -- BST:-- PLS:----
FORMAT:22
0005000001010B000600010200020040 710AEC1A19F7070000021BFF000009D4
C8000073000000002106020F02080001 00000007057A77645F68646C632E6300
00010009D4C80009C3F65A5A5A5A5A5A 5AFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF
FFFFFFFFFF
F5870 E8 N0763 STATIST BPB BOARD LW EXCEPTION 16-10-30 03:17:08
ALARM CLASS:CENTRAL:002
P204:LTG1 :LTU2 :014: 00 : 0 -- -- BST:-- PLS:----
FORMAT:43
REASON:02H EVENT CODE OR PARAMETER NOT EXPECTED
7E021BFF000009D4C800007300000000 2106020F0208000100000007057A7764
5F68646C632E630000000009D4C80009 C3F6FFFFFFFFFFFFFFFFFFFFFFFFFFFF
F5870 E8 N0764 STATIST BPB BOARD LW EXCEPTION 16-10-30 03:17:08
ALARM CLASS:CENTRAL:002
P204:LTG1 :LTU2 :014: 00 : 0 -- -- BST:-- PLS:----
FORMAT:43
REASON:02H EVENT CODE OR PARAMETER NOT EXPECTED
7E0202FF250009D4C815022400000000 5506020F220C101100000007057A7764
5F68646C632E63000000000000000000 00000001000000000000000000000001
000000000001000000000009D4C80009 CC7A0009CA3001152502FFFF00000000
000000000000FFFFFFFFFFFFFFFFFFFF FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF
F5870 E8 N0765 STATIST BPB BOARD LW EXCEPTION 16-10-30 03:17:08
ALARM CLASS:CENTRAL:002
P204:LTG1 :LTU2 :014: 00 : 0 -- -- BST:-- PLS:----
FORMAT:43
REASON:02H EVENT CODE OR PARAMETER NOT EXPECTED
7E0202FF250009D4C815022400000000 5506020F220C101100000007057A7764
5F68646C632E63000000000000000000 00000001000000000000000000000002
000000000001000000000009D4C80009 CC7A0009CA3001152502FFFF00000000
000000000000FFFFFFFFFFFFFFFFFFFF FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF
F5870 E8 N0766 STATIST BPB BOARD LW EXCEPTION 16-10-30 03:17:08
ALARM CLASS:CENTRAL:002
P204:LTG1 :LTU2 :014: 00 : 0 -- -- BST:-- PLS:----
FORMAT:43
REASON:02H EVENT CODE OR PARAMETER NOT EXPECTED
7E0202FF250009D4C815022400000000 5506020F220C101100000007057A7764
5F68646C632E63000000000000000000 00000001000000000000000000000003
000000000001000000000009D4C80009 CC7A0009CA3001152502FFFF00000000
000000000000FFFFFFFFFFFFFFFFFFFF FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF
F5340 E8 N0767 TEMPLOCK BPB BOARD CONTR RESP ERROR 16-10-30 03:17:08
ALARM CLASS:SWU-PER:000
P204:LTG1 :LTU2 :014: 00 : 0 -- -- BST:-- PLS:----
FORMAT:22
02F000B9002000603101B00703BC5101 001300000B5A5A5A5A5A5A5A5A5A5A5A
5AFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF
FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF
FFFFFFFFFF
....................
F5345 E8 N0821 TEMPLOCK BPB BOARD INIT ERROR 16-10-30 03:28:39
ALARM CLASS:SWU-PER:000
P204:LTG1 :LTU2 :014: 00 : 0 -- -- BST:-- FW: -
INIT-ERR: BOARD DEFECTIVE LOAD-ERR: BOARD NOT LOADED
FORMAT:23
F4293 M8 N0822 NO ACT BPB DEP POSTLOAD ACTION 16-10-30 03:28:39
ALARM CLASS:CENTRAL:023
P204:LTG1 :LTU2 :014: 00 : 0 -- -- BST:08 FW: -
INIT-ERR: BOARD DEFECTIVE LOAD-ERR: BOARD NOT LOADED
FORMAT:23
...............
F5372 E8 N0846 INSTRIAL BPB BOARD BACK IN SERVICE 16-10-30 04:06:39
ALARM CLASS:SWU-PER:000
P204:LTG1 :LTU2 :014: 00 : 0 -- -- BST:-- FW: -
FORMAT:43
TRIAL NO: 4
F5345 E8 N0847 TEMPLOCK BPB BOARD INIT ERROR 16-10-30 04:08:21
ALARM CLASS:SWU-PER:000
P204:LTG1 :LTU2 :014: 00 : 0 -- -- BST:-- FW: -
INIT-ERR: BOARD DEFECTIVE LOAD-ERR: BOARD NOT LOADED
FORMAT:23
F5372 E8 N0848 INSTRIAL BPB BOARD BACK IN SERVICE 16-10-30 05:07:40
ALARM CLASS:SWU-PER:000
P204:LTG1 :LTU2 :014: 00 : 0 -- -- BST:-- FW: -
FORMAT:43
TRIAL NO: 5
F5345 E8 N0849 TEMPLOCK BPB BOARD INIT ERROR 16-10-30 05:09:22
ALARM CLASS:SWU-PER:000
P204:LTG1 :LTU2 :014: 00 : 0 -- -- BST:-- FW: -
INIT-ERR: BOARD DEFECTIVE LOAD-ERR: BOARD NOT LOADED
FORMAT:23
F5876 E8 N0850 OUT SERV BPB BOARD NOT IN SERVICE 16-10-30 05:09:22
ALARM CLASS:SWU-PER:000
P204:LTG1 :LTU2 :014: 00 : 0 -- -- BST:-- FW: -
FORMAT:18
Диск на проблему DIUT2 1-2-14 особо не влияет.
Диск менять нужно, но замена не исправит ситуацию с DIUT2.
Можно посмотреть
STA-HISTA:SEARCH, 2016-10-30/00:01,2016-10-30/03:30;
STA-HISTA:SEARCH, 2016-10-29/20:00,2016-10-29/22:00;
Расскажите, что Вы сделали и покажите
DIS-DDSM:A1,C,1;
Как я понимаю полки не загружаются или загружаются частично.
Очень похоже, что основной диск с дефектами о области LW.