shmiller
14.04.2006, 16:56
Здравствуйте, уважаемые!
Хотел бы поделиться опытом по диагностики одной неприятной неисправности в 61-ом Меридиане.
Однажды, в далеком 2004 году наша организация, небольшой местный оператор связи, приобрела Меридиан 61 Саксэшн 4. Представлял он из себя две колонны по несколько полок каждая (4+2 точнее), напичканные различными платами… помимо аналоговых, цифровых и декта, были PRI, MISP, SILC, CallPilot, MIRAN, ITG и проч. платы.
Поставка станции свершилась в мае 2005 года. Привезли уже в сборе и с воткнутыми платами. Несколько специалистов нортела 2 недели кружила вокруг нее. Пока стойку питания установили, пока кросс наладили, пока тесты прогнали... короче, поставили, завели и переключили весь функционал в выходные.
Сначала все было замечательно, но потом во время установки в шелф 0 платы PRI произошел сбой - станция ушла в самопроизвольную перезагрузку... и не вышла оттуда.
Грузиться, что-то пишет, а потом restarting fpga reason и снова уходит в перезагрузку и так до бесконечности. Это было в 14:00 среды. Сами догадываетесь, что клиенты с нас с живых скальп сняли каждый по два раза (это где-то 1000-1500 народу). Несколько часов - ничего так и не удалось решить... как только не перезагружали, как ни пытались достучаться – тщетно. Приехали ребята-инженеры от обслуживающей компании (не скажу какой) тоже ничего не поняли, но за следующие 1,5 часа весь функционал со всеми приблудами был перенесен на старую станцию – парочку 11С. Удовлетворили клиентов.
А уже на следующий день к нас привезли вырванную у кого-то с боями 61 (!) – две процессорные полки. Переустановили, завели, поставили базу с какого-то старого бэкапа – все заработало отлично! Перезагрузили несколько раз – вроде бы все нормально... далее снова 11С в сторону и весь функционал опять на 61С.
Так никто и не понял, почему два расплитованных процессора не грузятся ни вместе, ни раздельно, никак! В перезагруз уходят и все тут.
Ну работает и ладно...
Через несколько месяцев... После плановой перезагрузки станция не поднялась... благо была суббота...
По самолюбию всех инженеров был нанесен сокрушительный удар... все кто был на ногах, в сознании или транспортабельный прибыли на место падения станции. Ковырялись, сносили базу, ставили с бэкапа – фиг! Отформатировали оба диска, заново все залили, ручками набили базу – поднялось! перегружали несколько раз – работает и заводиться! Ура!!! Да вот только до неиспользуемой ITG руки не дошли...
Через несколько месяцев... :) запрограммировали ITG, а потом настал опять какой-то необходимый процесс перезагрузки и, что бы вы думали, станция опять отмерла... мы в шоке... благо теперь уже опыт есть – станция встала с бэкапа периода без ITG (!). Вся работа была выполнена за три часа.
Ну вот думали мы и нашелся виновник – это ITG. Запросили объяснения в Нортеле, на что последний заявил, что «такого не бывает, станцию ITG не перезагружает, базу не портит и вообще... с 61 такого никогда не было, значит вы все придумали, проверьте электричество»
Дальше началась титаническая работа по тестированию каждой маломальски функциональной детали, постоянные перезагрузки в разных режимах. Результаты тестов нас убивали - станция не поднимается без форматирования обоих дисков и установки всего с нуля... баста.
Когда надежда иссякла, когда Нортел был предан анафеме мы решили его... пропылесосить:))
В отсосе пыли дошла очередь до шелфа 1 до верхней полки, а точнее до ее блока питания. Когда мы его сняли, то сразу же заметили необычное «явлении»е. Между, как бы это сказать, металлической корзиной куда ставятся платы и самим констуктивом платы был зажат провод. Определили, что это какой-то шнурок от конденсатора, выполняющего функции логического возврата земли (как-то так). После замены этой полки все стало отлично, перезагрузки и тесты теперь в норме. Не верилось даже, что из-за этой «мелочи» происходят столь неприятные вещи.
Полка с этим зажатым проводком у нас есть, если хотите, могу сфотографировать или сводить на экскурсию. Где и кто ее собирал? Уроды.
Спасибо инженерам компании (не скажу какой) они своими героическими усилиями в любое время дня и ночи спасали нас. Отдельное спасибо Олегу, Максиму, конечно, Денису!
kkk_GAZ240
14.04.2006, 17:47
Да, поучительная история о прописной истине электроники.
Электроника - наука о контактах! они есть где их не должно быть и их нет где они должны быть.
А вьетнамцы тут не причем. Мексиканцы скорее приложили свои немытые руки.
Предварительно нажравшись коки:D
:) Забавно.
Скажите компанию, ищем подобную :)
К сожалению снижение качества комплектующих это реальность.
Раньше я знал только про бракованные аппараты 39хх, а теперь услышал про платы цифровых телефонов на которых есть некоторые порты на которых телефоны вырубаются по несколько раз в день. И еще платы СЛ на которых некоторые ТН всегда находятся в коротком.
Мексиканцы с венграми зажигают :)
А еще БП в миньках китайского производства горят не плохо. :)
А еще был глюк со шлейфами CNI - IGS на бэкплейне корэнета. Первая группа никак не виделась.... три дня в новогодние праздники....с участием саппорта Любимого Вендора... Оказалось заделка шлейфа на разъеме херовая - ножи раздвинуты будто туда провода ответкой х...ли...написано иреланд....сапорт своим глазам не верил.
А коллеги из конкурирующей :-) фирмы недавно поменяли все фиджи, один проц и все сиэнайки при апгрейде 61с на 81 - все приехало битое. Тоже "повезло" надо сказать....так вот.
А БП от 11с китайских штук пять под столом наверное...
ivanopulo
17.04.2006, 20:56
а регулярно оказывающиеся открученными винтики крепления слотов PCMCIA?(ладно хоть из пластиковой упаковки не вылетают - прикрутить обратно можно)
а недавно пъедестал попался, в котором один из фиксаторов фан-блока отсутствовал, а в соседнем - провод передавлен и модуль из-за этого так перекосило, что системный монитор ни вставить ни вытащить... а так-же РЕГУЛЯРНО(!) попадаются непротянутые провода DC-шной колодки уходящие в станцию... от ЭПУ протаскиваешь, затягиваешь "от души", а потом станция сбоит и потрескивает так нехорошо... внутрь заглядываешь, а там монтажные провода из этой колодки можно пальчиками без усилий взять и вытащить!
короче - много... нет - НЕПОЗВОЛИТЕЛЬНО МНОГО брака стало... и это печально... раньше несмотря на цены не стыдно было заказчику в глаза смотреть... типа "фирма веников не вяжет!"
а теперь уже стыдно...:(
... не далее чем вчера окончательно определился один непонятный абсолютно глюк с 11С у клиента. Необслуживаемая станция, стоит в тьмутараканском уезде, сидят на ней два десятка абонентов, раз в столетие прилетает ворон... в общем, приехал парняга запрограммить парочку абонентов, а станция не отвечает - мессаги на экран выдает, а с лаптопа нифига не принимает. Поменял порт, потом нульмодемный шнурок, поменял треххвостку, поменял переходник, поменял лаптоп - результ тот-же. Подцепился по IP - такая-же фигня. Парень оказался упорный - собрал ВСЕ кишки (треххвостку, переходник, нульмодемный шнур, лаптоп, даже маму содрал) и притащил их на рабочий статив. ВЕСЬ комплект на другой станции работает нормально, все программится на раз, а вставил чужую мамку- о-па, и там не видит команд нифига.
При перезагрузке станции на ctrl-I и ctrl-B тоже не откликается, лог перезагрузки пишется самый обычный, без всяких траблов (собственно, IP-адрес по нему и вычислился, хоть и не помогло) то есть полное впечатление, что на маме (!) не работает прием. Получилась вещь в себе.
А теперь внимание - вопрос - И ЧТО ДЕЛАТЬ-ТО, собссно ??? Станция уже не гарантийная, у нас с клиентом договора на обслуживание нет, я его смело могу посылать с точным указанием маршрута и конечной точки, но мне самому интересно стало, ЧТО за хрень творится ??? Плохо то, что станция в двух тыщах кэмэ, не могу сам ручками пощупать... Какие у кого будут идеи ???
Надо бы у перца узнать подробнее, что и как он переставлял и как определил, что неисправна именно материнская плата. ИМХО титивай могут погибнуть - у самого такой SSC валяется, как водится, под столом :-)
А вот могет быть ethernet живой, так что шансы еще есть.
Возможно не получилось в станцию попасть из-за несконфигуренного PTY - ну так это поправимо.
ivanopulo
19.04.2006, 06:24
TheRam пишет
ИМХО титивай могут погибнуть - у самого такой SSC валяется, как водится, под столом :-) TTY чинится легко (в 99% случаев) подкинь "по-дружбе" занакомым чинильщикам-электронщикам и будет тебе счастье!
>Надо бы у перца узнать подробнее, что и как он переставлял
Итак, алгоритм, после того, как увиделось, что станция не откликается на команды:
- Поигрался с разными терминалками, со скоростями, стоповыми битами, эмуляциями, etc. Получил в худшем случае кракозябры от станции, в лучшем ничего не поменялось, станция не откликнулась
- Ресетнул, увидел лог загрузки, вытащил из него IP-адрес
- Подключил IP-шнурок, прошил на лаптопе нужные примочки, не увидел станции вообще - не пингуется (PTY точно зашит, IPшник и прочая лабуда тоже есть, имхо - ELNK задизэйблен)
- Заменил нульмодемный шнурок
- Заменил модем-элиминатор(396, естессно)
- Заменил компьютер
- Заменил треххвостку
- - Собрал ВСЕ барахло в кучу, вытащил на всякий случай маму и поехал на другой объект с рабочим кабинетом.
- Прикрутил там весь комплект - все работает как часики.
- Сменил материнку, включил станцию, увидел лог загрузки, но станция не откликается
- Ресетнул, попытался залезть через Ctrl-B, Ctrl-I, - такая-же фигня, станция просто не видит команд(на терминалке огонек передачи честно моргает - комп посылает инфу в порт... точнее, в никуда).
... Итак, у кого какие мысли ??? К SSC подкрался пушной зверек с ценным мехом??? В морг ? Можно, конечно, вытащить донгл с флэшкой, прошить IP, как положено, включить, переставить все обратно... Вот только товарисч тамошний этого делать не обучен совсем, а я ну уж слишком далеко, да и не очень-то ему весело рабочую станцию пристреливать надолго, и за часовое отсутствие связи чуть наизнанку не вывернули...
на 3-хвостовке есть ТРИ порта.
По всем 3 такой же зверёк прошёлся?
А по поводу PTY - сколько раз было 117 настроят полностью, а про pty забыли...
>По всем 3 такой же зверёк прошёлся?
да, ни с одного из шнурков команды не принимаются
>117 настроят полностью, а про pty забыли...
эт точно. поэтому чтоб не забывали, у меня он прошит вместе с лабовскими айпишниками в нуль-базе :-)
ресетил как: по питанию или инициализацию?
Нет, траблы похоже именно в материнке, так как на исправной все работает, да и не пингуецца ...пока никаких мыслей, окромя пушного зверя....ну или как советует ivanopulo может знакомый паяльщик-электронщик...
если ресет по питанию не помогает и elnk не поднимается - то зверёк в гости пришёл. и решил остаться до ремонта...
2Sokolik - Всяко ресетили, и так, и эдак
2TheRam - Вот и я так думаю, что опаньки... а насчет паяльщика - ТАМ окромя сусликов и вахтовиков никого не водится :-)
Так что, имхо, по-любому плату придется на че-то менять и тащить в Алма-ату... Резюме - ребята, однако, встряли :-(
Всем спасибо за деятельное сочувствие :-)
ivanopulo
02.05.2006, 09:41
так вот... про апгрейд на cp pIV...
станция 81С, 2001 года рождения, в рождении принимали участие спецы одной известной всем компании (не буду говорить какой, т.к. аккуратность исполнения не на высоте:-( )
с БП мы лоханулись... не проверили поставку и...(читай "различия блоков питания AD и CА ") ввиду этого (отключение АТС вырывали из руководства с боем) в положенное время станцию погасили и стали выполнять все физические процедуры апгрейда (БП в это время ехали к нам за 1000км). под утро они благополучно прибыли на место.
включаем, инсталлим (радуемся за скорость установки софта - порядка 10 минут на проц), соединяем, процы "снюхались", все ок., вызовы идут, тестируем, правим "мелочевку", EDD, SCPU... станция встает... кхм... в такую позу, что-бы нам было удобнее с ней "по-настоящему"... ругается на все... вообще на все... (MSDL, SDI, CC, FIJI, CNI, 3PE,...) ругается непрерывно...
перепускаем. встает. все тесты - ок! принудительная прогрузка всего, что можно прогрузить, SCPU... встает в ту же позу...
думаем. пускается каждый раз на 0-м проце... принудительно пускаем на 1-м. поза наступает сразу. вывод - в первом косяк...
думаем... меняем местами по очереди (каждый раз пытаясь запустить) CNI, 3PE, FIJI, CC, SUTIL, CP, все кабели... результата - никакого...
думаем... все сходится на корзину...
меняем местами корзины (а к этому времени - представляете как мы за.......сь) неисправность перемещается... корзину взять негде... думаем...
последнее, что остается - для "очистки совести" поменять шнурочки штатно проложенные на задней стороне корзины... меняем... неисправность переместилась (!) кроя всеми словами пьяного мексиканского педро вычисляем конкретный шнурок (им оказался один из двух CNI-3PE group 0), разбираем - проблема обнаруживается визуально - один из контактов провалился внутрь разъема...
если у кого есть подобный шнурок, то можете взглянуть на его "бэкпэнельную" часть - с торца видны лепесточки-фиксаторы удерживающие контакт на месте, а теперь взгляните, на толщину пластмасски, в которую он должен упереться... может это быть надежным?...
вот так... спасло нас только то, что время отключения было заявлено с 19 часов, до 22 часов, но... следующего дня!
или сработал принцип, что любая работа стремится занять все отведенное для нее время?...
а еще у меня в этой поездке права забрали, кнопка габаритов ночью сломалась и на летней резине два раза в трындецовый снегопад попали...
за что???????????:confused: :confused: :confused:
зы: еще вспомнил про качество сборки - попался недавно проц от 11-ой, с недощелкнутой "батарейкой" - время сбивалось... мелочь, а неприятно...
Бывает же.. Наука о контактах, как постоянно говорит коллега. :)
У меня был случай, что не работал аккумулятор для 11С. Оказался непропай одного крайнего контакта на плате внутри аккумулятора.
Lev Serdukov
02.05.2006, 14:39
Хе... Недавно видел плату которая во всех местах, включая плассмассу на морде, была промаркирована как плата цифровых абонентов хотя являлась платой аналоговых абонентов. :(
Занятно как....у меня где-то на складе валяется ровно с таким же приколом - но цифровая, хотя морда пластмассовая от аналоговой, и лейблы тоже.
Но надо отдать должное - на самой плате честно написано что цифровая.
ivanopulo
02.05.2006, 15:57
:D :D :D
поменяйтесь "мордами"!!!!
ivanopulo
12.05.2006, 15:40
ну а вот еще прикольчик
родная дискетка проработала в MMDU совсем немного... ну пару месяцев может...
результат в пристегнутом файле
Это дырка, или так затерто? :)
ivanopulo
12.05.2006, 16:18
магнитный слой стерт "в ноль"
Ну вот, теперь снова прОколы от Производителя.
Ставлю 61с CPP4. Один из процев глух как в танке. В терминал при загрузке ни-че-го. CF не читает да и шину PCI похоже не инициализирует, ибо CNI-ка светодиодами гаснет и не включает больше. Короче труп.
Ставлю резервный, купленный под этого клиента для сервиса. Немного лучше, но... в реданданси не становится, пишет interrupt: panic: при подключенном HSP, а при отключенном естественно имею два активных коре...когда аудит обнаруживает, что у другого здоровья больше - пытается переключить на него колпроцессинг...в общем каша полная... выяснилось что у этого проца проблема с биосом и как следствие с эзернетом - надо менять по бюллетеню...мдя...
Думаете все? Хренушки. Не работает ринг генератор в одной из полок. Прыгал вокруг как макак по кукурузному полю - неа... вытащил из пьедестала модуль куда питание заводится - дык кабель питания который идет в полки недовставлен и защелкнут только на один фиксатор, недотыкнут..недотыкомка блин...
Такие дела....
За последний год было купленно примерно 300 аппаратов 3901 и 3902.
В процесе установки и в первые недели работы вышли из строя 24 аппарата то есть примерно 8%.
Когда мы сдали по гарантии нам сказали (неофициально) что все аппараты были сожены.
Подскажите кто в последние годы закупал телефоны 39хх серии много ли у вас вышедших из строя телефонов.
Или может мне надо искать причину таких наводок в линиях.
Zero!! пишет
что все аппараты были сожены.
Да были такие, из разных регионов. Тоже много. Предохранители погорели - факт. А горят они от вызывного напряжения. Тоже "неофициально" выяснили, что аппараты для начала растащили по домам, а когда выяснилось что дома они не работают (надо же дрянь какая!) по тихому вернули "взад".
shmiller
12.02.2007, 21:02
TheRam пишет
Да были такие, из разных регионов. Тоже много. Предохранители погорели - факт. А горят они от вызывного напряжения. Тоже "неофициально" выяснили, что аппараты для начала растащили по домам, а когда выяснилось что дома они не работают (надо же дрянь какая!) по тихому вернули "взад".
ух молодцы какие.
у нас опыт: не более 2-3% выходят из строя
как правило, дохнут 3902
Zero!! пишет
За последний год было купленно примерно 300 аппаратов 3901 и 3902.
В процесе установки и в первые недели работы вышли из строя 24 аппарата то есть примерно 8%.
Когда мы сдали по гарантии нам сказали (неофициально) что все аппараты были сожены.
Подскажите кто в последние годы закупал телефоны 39хх серии много ли у вас вышедших из строя телефонов.
Или может мне надо искать причину таких наводок в линиях.
С 1998 года маленькая партия 3901 от "ЮНИ" работает вся без проблем по обычным телефонным парам. В 2004 году четыре аппарата 3901, приобретенные у другого диллера продержались пол-года. В брюхе у них обнаружил предохранители по полампера в каждый провод, они целые, но аппарат на линии дает кз.
dasa пишет
С 1998 года маленькая партия 3901 от "ЮНИ" работает вся без проблем по обычным телефонным парам. В 2004 году четыре аппарата 3901, приобретенные у другого диллера продержались пол-года. В брюхе у них обнаружил предохранители по полампера в каждый провод, они целые, но аппарат на линии дает кз.
Тут без разницы у кого покупать - все равно ж не они их делают... А вот год и место производства - очень сильно на процесс влияют.
finair пишет
Тут без разницы у кого покупать - все равно ж не они их делают... А вот год и место производства - очень сильно на процесс влияют.
Обычный процесс. Интересно, кто занимается ремонтом аппаратов Нортеля в СНГ и дает гарантию?
Недавно зарегистрировал IP-фон i2002, но он циклически перезагружался, т.к. пытался обновить firmware с версии D31 на текущую версию, но у него это не получалось.. Поиски привели к бюллетеню, в котором указано что IP-фоны серии 200x, произведенные между 7 октября и 10 ноября 2004 года, и имеющие серийных номер, начинающийся на NNTMDF, не поддерживают обновление прошивки:
Products that do exhibit the problem have had the Flash memory chip locked incorrectly within the manufacturing process, and these units will not accept a firmware upgrade from a call server.
Но не все аппараты из этой серии!:
It is known that not all product have the issue since it has been determined that only one programming station within the manufacturing process was locking the flash memory chip incorrectly.
Хоть признались честно!
ЗЫ: телефон оказался не из этой "проклятой" партии, и успешно прошился и заработал ночью, когда снизилась нагрузка на сигнальный сервер. :)
ivanopulo
28.05.2007, 12:52
а вот еще чудо сборки...
ну... я понимаю, конечно, что все "не в восторге", мягко говоря, от этих защелок, но зачем уж так-то... зачем под лицевую панель прятать?
Кхе...ноу хау, чтоб больше не мучиться :-)))
ivanopulo пишет
а вот еще чудо сборки...
ну... я понимаю, конечно, что все "не в восторге", мягко говоря, от этих защелок, но зачем уж так-то...
Мда... но это, как говорил классик - "для знатоков штучка". :) Как вспоминаю до крови разбитые пальцы - сразу вздрагиваю... :)
А может это был первый шаг вендора к "а ну его напиг эти разъемы..." ;)
ivanopulo
29.12.2007, 13:59
ситуация (битый, штатно проложенный кабель, для группы "0"), описанная мной в посте №19 (ежели не просчитался) повторилась почти один-в-один у одного из наших сотрудников!!!!!!!!!!!!
но! благодоря нашим страдания в вышеописанной ситуации - справился быстро...
как теперь модно говорить - "я в шоке"
ivanopulo
03.07.2008, 17:30
примерно раз в пол-года поднимаю эту ветку... хоть "приклеивай" :)
очередной перл:
пять минут назад позвонили монтажники с объекта и рассказали душераздирающую историю, как в 11-ом кабинете разъем для MDF кабеля (только один!) оказался запаян "вверх ногами"!!!
если завтра сфоткаю - выложу здесь...
решение: варварски загибаем кабель у самого разъема и заталкиваем разъем на место (машинка есть и разъемы новые есть, но до этой радости ехать 600 км, поэтому переоконечить - не предлагать! :) )
после этого, остается не забыть расшить кабель "шиворот на выворот и задом на перед"
На одном из объектов время от времени происходит такой глюк:
Зависает телефон М3902, но зависает весьма странно. На нем продолжает показываться время и горит акод городского роута с номером транка. На кнопки телефон не реагирует только на холодную перезагрузку. Но зато при звонках по этому транку он их озвучивает по громкой связи! Учитывая что нередко зависание происходит на номере главного бухгалтера начальство сильно недовольно.
ivanopulo
08.07.2008, 09:28
ivanopulo пишет
если завтра сфоткаю - выложу здесь... кабель выдергивать не стал. пожалел его... и так перегнутый...
И это реально работает?? В смысле,телефоны подключены к карте в 5 слоте и работают?
ivanopulo
08.07.2008, 09:42
а почему им не работать???
только кабель надо с конца расшивать и провода в паре местами поменять (для соблюдения полярности)