Cyanide
01.08.2017, 12:08
Друзья, недавно начались непонятные проблемы со станцией. Стали появляться внезапные пропадания тонов, например КПВ внешних станций, будь то городские или учрежденческие. Дальше больше, в постоянном бутлупе процессор B. Чего только не делали, меняли процессоры, меняли соответствующие RTM, полностью обесточивали и запускали заново - бутлуп. В общем, заменили целиком блок CPCI на станцию которая работала в лаборатории - перекинули донгл, систему восстановили с регенов, накатили все последние хотфиксы, в общем станция заработала. Точнее работала нормально пару дней. Потом в бутлуп ушел процессор А.


В hista серии ошибок:

F4057 M8 N5642 NO ACT BPB CP DBAR 17-08-01 11:30:00
ALARM CLASS:CENTRAL:023
CC:00566 EC:00506 UA:A318:212F SP:0FF4:156A LD:01-33-001-022
DT:6C ST:6F SN: 1 CEVT:2A CSEV:6C CST: 0
FORMAT:24 MESSAGE-ID: 06567

FF030101 A70B0504 0201040F 05000000 20000000 00000000 00000000 00000000
00000000 00000000 00000000 000F0F0F 0F0F0F00 00000000 00000000 00000000
00000000 00000000 00000000 00000000 00000F0F 0F0F0F0F 00000000 00010100
00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000
00000000 00000000 00000000 00000000 00000000 00000000 0000000C 00000000
000F0F0F 0F0F0F00 0A0A0A0A 0A0A0101 FF040501 03050800 00003101 D940

F4057 M8 N5643 NO ACT BPB CP DBAR 17-08-01 11:30:00
ALARM CLASS:CENTRAL:023
CC:00566 EC:00506 UA:A318:212F SP:0FF4:156A LD:01-33-001-022
DT:6C ST:6F SN: 1 CEVT:2A CSEV:6C CST: 0
FORMAT:24 MESSAGE-ID: 06567

F8266 M4 N5644 NO ACT A1 TRANSSYS ON CONN LOSS OS 17-08-01 11:30:02
ALARM CLASS:CENTRAL:023
PARTNER:BPA IP-ADDR:192.0.2.1 TCP-PORT:640
LOCAL: IP-ADDR:192.0.2.3 TCP-PORT:0
** : :A1 B :062: Q2311-X DSCXL BST:12 FW: H062-N
FORMAT:3C
SUB-MSG-NO:1

F8266 M4 N5645 LOCK BPB TRANSSYS ON CONN LOSS OS 17-08-01 11:30:03
ALARM CLASS:CENTRAL:023
PARTNER:BPA IP-ADDR:192.0.2.1 TCP-PORT:612
LOCAL: IP-ADDR:192.0.2.2 TCP-PORT:0
P202: :CC B :005: Q2311-X DSCXL BST:12 FW: H062-N
FORMAT:3C
SUB-MSG-NO:1

F6166 E8 N5646 NO ACT A1 SM-CR ADVISORY 17-08-01 11:30:03
ALARM CLASS:CENTRAL:023
FORMAT:C
CDR: DATCOL TABLE INCORRECTLY EXECUTED
NO TARIFFTABLE IN TTBLGROUP 0 FOR CARRIER 3

F5258 E8 N5647 NO ACT BPB DCL HSR ADVISORY 17-08-01 11:30:05
ALARM CLASS:CENTRAL:016
FORMAT:42 MESSAGE-ID: 06628 MESSAGE 01 OF 01
ADDR: B138:80CC ERROR-CODE: C21C
Unexpected message TLI
0000659C2222215A5A5A5A5A5A5A5A5A 5A5ADC0080252C5F0000010000370100
0041002800DC0080252C5F0000C0A8C8 28013400282D00FFFF00002310640400
00010000FFFF0000FFFF000000145802 FFFF0000FFFF0000FFFF0000FFFF0000
FFFF0000FFFF0000FFFF000000000500 000000007B0000000000000001060000
00000000000000000000FFFFFFFFFFFF FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF

F5258 E8 N5648 NO ACT BPB DCL HSR ADVISORY 17-08-01 11:30:05
ALARM CLASS:CENTRAL:016
FORMAT:42 MESSAGE-ID: 06629 MESSAGE 01 OF 01
ADDR: B138:80CC ERROR-CODE: C21C
Unexpected message TLI
0000659C2222215A5A5A5A5A5A5A5A5A 5A5ADC0080252C5F0000010000370100
0041002800DC0080252C5F0000C0A8C8 28013400282D00FFFF00002310640400
00010000FFFF0000FFFF000000145802 FFFF0000FFFF0000FFFF0000FFFF0000
FFFF0000FFFF0000FFFF000000000500 000000007B0000000000000001060000
00000000000000000000FFFFFFFFFFFF FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF

F6166 E8 N5649 NO ACT A1 SM-CR ADVISORY 17-08-01 11:30:15
ALARM CLASS:CENTRAL:023
FORMAT:C
CDR: DATCOL TABLE INCORRECTLY EXECUTED
NO TARIFFTABLE IN TTBLGROUP 0 FOR CARRIER 3

F8267 M4 N5650 IN SERV BPB TRANSSYS ON CONN OS NEW 17-08-01 11:30:16
ALARM CLASS:CENTRAL:023
PARTNER:BPA IP-ADDR:192.0.2.1 TCP-PORT:0
LOCAL: IP-ADDR:192.0.2.2 TCP-PORT:0
P202: :CC B :005: Q2311-X DSCXL BST:12 FW: H062-N
FORMAT:3C
SUB-MSG-NO:1

F4266 M8 N5651 NO ACT BPA DEP ADVISORY 17-08-01 11:29:52
ALARM CLASS:CENTRAL:005
CC:65535 EC:65535 UA:FFFF:FFFF SP:FFFF:FFFF LD:00-00-000-000
DT:FF ST:FF SN:FFFF CEVT:FF CSEV:FF CST:FF
FORMAT:24

40AE0168 30190000 00000000 20045254 4D322E37 63647363 72746D30 31312F32
312F3037 00000000 00000000 00000000 00000000 00000000 00000000 00000000
00000000 00000003 5A5A5A5A 5A5A5A5A 5A5A5A5A 5A5A5A5A 5A5A5A5A 5A5A5A5A
5A5A5A5A 5A5A5A5A 5A5A5A5A 5A5A5A5A 5A5A5A5A 5A5A5A5A 5A5A5A5A 5A5A5A5A
5A5A5A5A 5A5A5A5A 5A5A5A5A 5A5A5A5A 5A5A5A5A 5A5A5A5A 5A5A5A5A 5A5A5A5A
5A5A5A5A 5A5A5A5A 5A5A5A5A 5A5A5A5A 5A5A5A5A 5A5A5A5A 5A5A5A5A 5A5A5A5A
5A5A5A5A 5A5A5A5A

Версия системы:

DIS-APS:,PSGL,Y0*;
H500: AMO APS STARTED
ADINIT STARTED
PROGRAM SYSTEM : Y0-EM0YC
VERSION NUMBER : 10
CORRECTION VERSION NUMBER : 001
PART NUMBER : P30252N4508BH2704|V3.0 R8.4.27
PROGRAM SYSTEM WITH CODE SUBSYSTEMS
INTERFACE VERSION:
PROGRAM SYSTEM DOES NOT CONTAIN ANY INTERFACE VERSIONS

DIR SUBSYSTEM | | OMF SUBSYSTEM
-----------------------+-+-----------------------
ZMITSC00.Y0-EM0.10.001 |*|ZMITSC00.Y7-PMT.10.001

ADINIT COMPLETED
STATUS = H'0000
AMO-APS -111 SOFTWARE LOAD UPGRADE
DISPLAY COMPLETED;

На этой станции порядка 20 IPDA полок c emergency, 10 Е1 с городом, с остальными аналогичными по версиям и железу HiPath 4000 v3 настроены IP транки h323.

CDW на станциях сетевые, разбрасываются HiPath 4000 Manager V6 R2.51.0

Тарификация настроена, коллекторы с менеджера отправляют данные на HiPath AMWin v2r8.1.2



Полагаю, что в какой-то момент перестает откликаться один из процессоров (по интерфейсу CC-A или CC-В) и станция начинает перезапуск "зависшего" процессора. Наверно ошибаюсь, и остро нуждаюсь в вашей помощи.

Заранее благодарю.

Нахожусь рядом с системой, если нужны какие-то дополнительные сведения могу представить оперативно.

masviss
01.08.2017, 12:55
Покажите картинку из Assistant ->Software Managment-> Software Activation ->
Detailed version info
Достаточно первое окно.

masviss
01.08.2017, 13:10
И покажите фото передней и задней части процессорного блока.
Нужно посмотреть как стоят RTM и цвет светодиодов на фронт части.

masviss
01.08.2017, 13:18
А перегружается только один из SWU процессоров?
И ещё
DIS-SDSM:A1,CHAN,ALL;

Cyanide
01.08.2017, 13:39
Так точно, перегружается один из SW процессоров.

DIS-SDSM:A1,CHAN,ALL;
H500: AMO SDSM STARTED

PROCESSOR TEMPERATURE : 50 DEGREE CELSIUS
BOARD TEMPERATURE : 26 DEGREE CELSIUS
------------------------------------------

H05: ON CPCI SWITCHES NO CHANNEL STATI ARE OUTPUT.
LOCAL MEMORY IN SWU:
CC-A: 256 MB
CC-B: 256 MB

AMO-SDSM -111 STATUS OUTPUT FOR SYSTEM SERVER
DISPLAY COMPLETED;

Cyanide
01.08.2017, 13:42
Скриншоты с Assistant

https://www.dropbox.com/s/r2mhqsve0f25a3i/111.png?dl=0
(https://www.dropbox.com/s/r2mhqsve0f25a3i/111.png?dl=0)

https://www.dropbox.com/s/4hkzfli8tizbcp2/222.png?dl=0
(https://www.dropbox.com/s/4hkzfli8tizbcp2/222.png?dl=0)

https://www.dropbox.com/s/7s472jdl54bi41z/333.png?dl=0
(https://www.dropbox.com/s/7s472jdl54bi41z/333.png?dl=0)

https://www.dropbox.com/s/i6ra986hcnq51wd/444.png?dl=0
(https://www.dropbox.com/s/i6ra986hcnq51wd/444.png?dl=0)

https://www.dropbox.com/s/ay8iqh4nc9urdxq/555.png?dl=0

masviss
01.08.2017, 13:46
Ok. С SW все в порядке.
Жду фото.

Cyanide
01.08.2017, 13:47
RTM процессора в перезагрузке горит красным, второй SW процессор в порядке, светодиод горит зеленым.

Фото с процессоров:

https://www.dropbox.com/s/8ngqdb32lr8g9y3/DSC_0021.JPG?dl=0

https://www.dropbox.com/s/47g85kt15juc0zk/DSC_0023.JPG?dl=0

masviss
01.08.2017, 13:48
Платы процессоров не меняли с тестовой станции?
Можно еще фото проц-в тестовой станции. Какая у тест. АТС версия?
Фото можете сделать?

Cyanide
01.08.2017, 13:53
Тестовая в той же версии, на данный момент к ней прикручена полка, оба процессора работают нормально. Прямо сейчас на тестовой станции процессор А - Standby, процессор В - Active.

Бывшие продакшн процессоры установлены в тестовую, процессоры тестовой в продакшне.


Фото тестовой станции

https://www.dropbox.com/s/b977hq05zb780fz/DSC_0024.JPG?dl=0

masviss
01.08.2017, 14:05
Проблема в RTM. Проц без RTM не будет работать.
Пока не решите проблему с RTM проц можно выключить. Как это сделать?
Выключить АТС, вынуть нераб RTM и нераб проц.
Включить АТС.
Проблема с RTM:
- внимательно посмотрите не загнулись ли ламели системного разъема места установки RTM в боксе CPCI.
- внимательно посмотрите на разъем на самом RTM, сравните с рабочей платой.
Наиболее вероятно первое.

masviss
01.08.2017, 14:12
Это можно сделать в удобное для Вас время.

Cyanide
01.08.2017, 14:26
В том и дело, что RTM абсолютно свежие. С рабочей станции.

masviss
01.08.2017, 14:29
А когда был старый CPCI ящик, такая же картина была?
Нижний RTM не работал?

masviss
01.08.2017, 14:31
Сообщите Ваш приватный e-mail.

Cyanide
01.08.2017, 14:41
Отправил в личку. Заранее спасибо!

masviss
01.08.2017, 15:35
Посмотри почту (2).

masviss
01.08.2017, 15:39
Посмотри второе сообщение.

Mark68
01.08.2017, 15:56
Сообщите Ваш приватный e-mail.

Всем Привет!..).
Результат,резюме,решение - можно будет, потом, показать сообществу!?)

masviss
01.08.2017, 16:01
Это прерогатива автора.

Mark68
01.08.2017, 16:22
Это прерогатива автора.

Понятно,что это Ваше право!,ну и автора конечно...))).Но и людям то было бы интересно узнать...чО да кАк!!)

..."Шутка"...,Всё нормально)))

Cyanide
01.08.2017, 16:31
Особого секрета нет :)
Просто по телефону обсудить проблему проще.

Уважаемый masviss порекомендовал проверить аппаратную часть. Как версия, может глючит какая-то полка, например модуль LTUCA. Для начала отключил соединительные кабели от RTM до полок, но безрезультатно, впрочем, это скорее подтверждает теорию, что у нас проблема исходит от одной из полок. Вечером проверю целостность контактов RTM, мало ли, может погнуты где-то. С другой стороны, с чего бы им гнуться? В любом случае, как минимум требуется одно отключение системы.

Mark68
01.08.2017, 16:48
Особого секрета нет :)
Просто по телефону обсудить проблему проще.

Уважаемый masviss порекомендовал проверить аппаратную часть. Как версия, может глючит какая-то полка, например модуль LTUCA. Для начала отключил соединительные кабели от RTM до полок, но безрезультатно, впрочем, это скорее подтверждает теорию, что у нас проблема исходит от одной из полок. Вечером проверю целостность контактов RTM, мало ли, может погнуты где-то. С другой стороны, с чего бы им гнуться? В любом случае, как минимум требуется одно отключение системы.

так...совет на "взлёт"...,сам видел...,если патч-корды до полок ,не от Сименса...,тоже могут быть "фокусы"))...,я тоже думал...что не может быть...,но ....)

Cyanide
01.08.2017, 17:44
так...совет на "взлёт"...,сам видел...,если патч-корды до полок ,не от Сименса...,тоже могут быть "фокусы"))...,я тоже думал...что не может быть...,но ....)

есть такое, согласен

но в данном случае соединительные кабели родные от сименса
пока ищу проблему

Mark68
01.08.2017, 18:08
есть такое, согласен

но в данном случае соединительные кабели родные от сименса
пока ищу проблему

...и БП...количество,состояние??,...потом HG-гу проверьте.....,ну а потом...можно и позвонить...Будем Посмотреть!))

Cyanide
02.08.2017, 08:10
Распишу подробно конфигурацию. Изначально глючила система с 48В источниками питания, два БП запитаны от DCDR, который в свою очередь подключен к внешнему источнику 48В с батареями и мощным стабилизатором. Тестовый конструктив пришедший на замену с БП на 220В переменного тока, так же оба БП в корзине, питание получают от 5кВт ИБП.

На станции стоят:

TOTAL OF THE REFERENCE CONFIGURATION

PARTNO FID TYPE | NUMBER
-------------------------+------------------------------------------------------
Q2316-X 3 STMI2HFA | 1 => 240 LINE CIRCUITS / PORTS
Q2196-X 1 DIU-N2 | 12 => 24 LINE CIRCUITS / PORTS
Q2226-X200 1 DIUT2-E1 | 1 => 2 LINE CIRCUITS / PORTS
Q2169-X100 1 SLMOP | 6 => 144 LINE CIRCUITS / PORTS
Q2316-X10 1 STMI2 | 2 => 2 LINE CIRCUITS / PORTS
Q2316-X10 2 STMI2IGW | 5 => 20 LINE CIRCUITS / PORTS
Q2225-X SLMAE | 18 => 432 LINE CIRCUITS / PORTS
Q2316-X 4 STMI2SIP | 2 => 4 LINE CIRCUITS / PORTS
Q2168-X 1 SLMO24 | 3 => 72 LINE CIRCUITS / PORTS
Q2316-X 2 STMI2IGW | 3 => 6 LINE CIRCUITS / PORTS
Q2316-X 1 STMI2 | 1 => 1 LINE CIRCUITS / PORTS
Q2316-X10 4 STMI2SIP | 2 => 8 LINE CIRCUITS / PORTS

Mark68
02.08.2017, 12:36
В том и дело, что RTM абсолютно свежие. С рабочей станции.

для теста поменять RTM местами.