Страница 1 из 1

smg1016m падает раз в 5 часов...

Добавлено: 30 окт 2019 19:10
BadBarmaley
smg1016m падает раз в 5 часов в независимости от нагрузки...

БЫЛЬ: Жила была станция, работала без единого косяка целых 2,5 года...
Прошивка была: ECSS-10 V.3.10.0.2447 M/PBX/SORM Build: Dec 15 2017 08:34:19
Последний раз на нее заходили и правили конфиг в августе месяце.
и походу устала...
Пару дней назад начала падать раз в ~5 часов. вот ни с чего.
Через web доступна, а вызовы не обрабатывает. в журнале ошибок (то что в web) - пусто.
во всех логах в /var/log тоже.
Процессор загрузка 100%.
в удаленный syslog шлет:

Код: Выделить всё

Oct 30 12:52:50 <smg1016m>  12:52:50.146889  [ERR ]  arp: error mac_lookup::socket() (errno Too many open files)
Oct 30 12:52:50 <smg1016m>  12:52:50.147209  [WARN]  net: failed to get socket fd for ping. err: Too many open files
Oct 30 12:52:50 <smg1016m>  12:52:50.147441  [ERR ]  arp: error mac_lookup::socket() (errno Too many open files)
Oct 30 12:52:50 <smg1016m>  12:52:50.158253  [ERR ]  arp: error mac_lookup::socket() (errno Too many open files)
Oct 30 12:52:50 <smg1016m>  12:52:50.158531  [WARN]  net: failed to get socket fd for ping. err: Too many open files
Oct 30 12:52:50 <smg1016m>  12:52:50.158744  [ERR ]  arp: error mac_lookup::socket() (errno Too many open files)
Oct 30 12:52:50 <smg1016m>  12:52:50.272407  [ERR ]  arp: error mac_lookup::socket() (errno Too many open files)
Oct 30 12:52:50 <smg1016m>  12:52:50.272631  [WARN]  net: failed to get socket fd for ping. err: Too many open files
Oct 30 12:52:50 <smg1016m>  12:52:50.272863  [ERR ]  arp: error mac_lookup::socket() (errno Too many open files)
Oct 30 12:52:50 <smg1016m>  12:52:50.278030  [ERR ]  arp: error mac_lookup::socket() (errno Too many open files)
Oct 30 12:52:50 <smg1016m>  12:52:50.278357  [WARN]  net: failed to get socket fd for ping. err: Too many open files
Oct 30 12:52:50 <smg1016m>  12:52:50.278517  [ERR ]  arp: error mac_lookup::socket() (errno Too many open files)
Oct 30 12:52:50 <smg1016m>  12:52:50.287767  [ERR ]  net: get local ip: error getip::socket() for eth0 (errno Too many open files)
Oct 30 12:52:50 <smg1016m>  12:52:50.287967  [ERR ]  net: get local ip: error getip::socket() for eth0:1 (errno Too many open files)
Oct 30 12:52:50 <smg1016m>  12:52:50.288131  [ERR ]  net: get local ip: error getip::socket() for eth0.1735 (errno Too many open files)
Oct 30 12:52:50 <smg1016m>  12:52:50.288255  [ERR ]  net: get local ip: error getip::socket() for eth0.100 (errno Too many open files)
Oct 30 12:52:50 <smg1016m>  12:52:50.304456  [ERR ]  net: get local ip: error getip::socket() for eth0 (errno Too many open files)
Oct 30 12:52:50 <smg1016m>  12:52:50.305211  [ERR ]  net: get local ip: error getip::socket() for eth0:1 (errno Too many open files)
Oct 30 12:52:50 <smg1016m>  12:52:50.305500  [ERR ]  net: get local ip: error getip::socket() for eth0.1735 (errno Too many open files)
Oct 30 12:52:50 <smg1016m>  12:52:50.305642  [ERR ]  net: get local ip: error getip::socket() for eth0.100 (errno Too many open files)
Oct 30 12:52:50 <smg1016m>  12:52:50.326277  [ERR ]  net: get local ip: error getip::socket() for eth0 (errno Too many open files)
Oct 30 12:52:50 <smg1016m>  12:52:50.326576  [ERR ]  net: get local ip: error getip::socket() for eth0:1 (errno Too many open files)
Oct 30 12:52:50 <smg1016m>  12:52:50.326820  [ERR ]  net: get local ip: error getip::socket() for eth0.1735 (errno Too many open files)
Oct 30 12:52:50 <smg1016m>  12:52:50.326994  [ERR ]  net: get local ip: error getip::socket() for eth0.100 (errno Too many open files)
Oct 30 12:52:50 <smg1016m>  12:52:50.337000  [ERR ]  net: get local ip: error getip::socket() for eth0 (errno Too many open files)
Oct 30 12:52:50 <smg1016m>  12:52:50.337429  [ERR ]  net: get local ip: error getip::socket() for eth0:1 (errno Too many open files)
Oct 30 12:52:50 <smg1016m>  12:52:50.337635  [ERR ]  net: get local ip: error getip::socket() for eth0.1735 (errno Too many open files)
Oct 30 12:52:50 <smg1016m>  12:52:50.337851  [ERR ]  net: get local ip: error getip::socket() for eth0.100 (errno Too many open files)

и так повторяется до бесконечности пока не ребутнешь.

Вчера обновил до: ECSS-10 V.3.16.0.3274 M/PBX/SORM Build: Oct 7 2019 11:37:11
Как видно из даты логов - безрезультатно.
Ждем 18 часов для очередного ребута...

Сразу в ремонт сдавать или есть что поковырять?

Re: smg1016m падает раз в 5 часов...

Добавлено: 31 окт 2019 09:27
Dmitriy_eltex
Здравствуйте.

Процессор загрузка 100%.

Может ее ломают? Какой процесс грузит? Выгрузку top делали?
Нужно прислать на мою почту:
1) Конфигурацию Вашей SMG (Сервис->Управление файлами конфигурации->Скачать);
2) Выгрузку команд в момент проблемы:

Re: smg1016m падает раз в 5 часов...

Добавлено: 31 окт 2019 14:43
BadBarmaley
Dmitriy_eltex писал(а):Может ее ломают? Какой процесс грузит? Выгрузку top делали?
Нужно прислать на мою почту:


Исключено. станция не доступна из вне. Абонентов на ней нет. Работает как транковый шлюз 3 оператора, СОРМ и софтсвитч.
К сожалению историю ssh не сохранил, но top такой:
/usr/bin/smg/mgapp ~70-80%
/usr/lib/erlang/"что-то_там" еще порядка 20-30%