Проблема возникала с:
NTE-RG-1402GC-W:rev.B
NTE-RG-1402G-W:rev.B
На версиях FW:
3.14.2.62
3.14.2.68
3.14.3.43
Проблема проявляет себя следующим образом:
Периодически (от нескольких раз в сутки до 1 раза за 2 недели) пропадает управление устройством как через epon0.6, так и через LAN интерфейсы. При попытке залогиниться на устройство появляется запрос ввода логина/пароля; после ввода логина/пароля (не важно - корректного или нет) через 7-15 секунд появляется повторный запрос на ввод логина/пароля. При попытке достучаться telnet-ом соединение отваливается по таймауту (в некоторых случаях таки приходит TCP ACK, но потом опять же тишина).
В период когда проблема присутствует, у NTEшек отваливается регистрация на SIP сервере, а в некоторых случаях (относительно редких) они так же перестают NATить трафик LAN клиентов. В то же время на epon0.1, epon0.5 и epon0.6 NTEшки обновляют аренду DHCP и отвечают на ICMP запросы.
Что помогает: reboot
Что не помогает: reconfigure и/или перевод в состояние unconfigured, длительное ожидание того, что "починится само" (впрочем, были случаи, когда само "отлипало").
Один раз получилось так, что в момент возникновения проблемы у меня была открытая telnet сессия на устройство. Получилось посмотреть:
Код: Выделить всё
> ps
PID USER VSZ STAT COMMAND
1 admin 1564 S init
2 admin 0 SW< [kthreadd]
3 admin 0 SW< [migration/0]
4 admin 0 SW [sirq-high/0]
5 admin 0 SW [sirq-timer/0]
6 admin 0 SW [sirq-net-tx/0]
7 admin 0 SW [sirq-net-rx/0]
8 admin 0 SW [sirq-block/0]
9 admin 0 SW [sirq-tasklet/0]
10 admin 0 SW [sirq-sched/0]
11 admin 0 SW [sirq-hrtimer/0]
12 admin 0 SW [sirq-rcu/0]
13 admin 0 SW< [migration/1]
14 admin 0 SW [sirq-high/1]
15 admin 0 SW [sirq-timer/1]
16 admin 0 SW [sirq-net-tx/1]
17 admin 0 SW [sirq-net-rx/1]
18 admin 0 SW [sirq-block/1]
19 admin 0 SW [sirq-tasklet/1]
20 admin 0 SW [sirq-sched/1]
21 admin 0 SW [sirq-hrtimer/1]
22 admin 0 SW [sirq-rcu/1]
23 admin 0 SW< [events/0]
24 admin 0 SW< [events/1]
25 admin 0 SW< [khelper]
28 admin 0 SW< [async/mgr]
78 admin 0 SW< [kblockd/0]
79 admin 0 SW< [kblockd/1]
88 admin 0 SW< [khubd]
105 admin 0 SW< [skbFreeTask]
106 admin 0 SW< [bpm]
122 admin 0 SW [pdflush]
123 admin 0 SW [pdflush]
124 admin 0 SWN [kswapd0]
126 admin 0 SW< [crypto/0]
127 admin 0 SW< [crypto/1]
184 admin 0 SW< [mtdblockd]
218 admin 0 SW< [linkwatch]
225 admin 0 SWN [jffs2_gcd_mtd2]
226 admin 1584 S -/bin/sh
255 admin 0 SW [kpAliveWatchdog]
292 admin 0 SW [bcmsw]
293 admin 0 SW [bcmsw_timer]
412 admin 1964 S /bin/lighttpd -f /etc/lighttpd/lighttpd.conf
413 admin 3908 S smd
414 admin 5428 S ssk
428 admin 1388 S dnsproxy
435 admin 1424 S dhcpd
450 admin 4816 S mcpd
504 admin 5508 S wlmngr -m 0
520 admin 1324 S /bin/wlevt
572 admin 5336 S swmdk
573 admin 6492 S eponapp -m 0
583 admin 1040 S bftpd -d
584 admin 5336 S swmdk
585 admin 5336 S swmdk
918 admin 1232 S dhcpc -f -i epon0.6 -d Eltex[Device:NTE-RG-1402GC-W:
922 admin 1232 S dhcpc -f -i epon0.1
926 admin 1232 S dhcpc -f -i epon0.5
1086 admin 1180 S /bin/eapd
1090 admin 1532 S /bin/nas
1132 admin 1284 S /bin/acsd
1179 admin 6492 S eponapp -m 0
1180 admin 6492 S eponapp -m 0
1181 admin 6492 S eponapp -m 0
1182 admin 6492 S eponapp -m 0
1183 admin 6492 S eponapp -m 0
1425 admin 5420 R tr69c -m 0
3859 admin 4444 S upnp -m 0 -L br0 -W epon0.1 -W2 epon0
4558 admin 6392 S httpd -m 0
4687 admin 1576 S syslogd -n -C -l 7
4688 admin 1560 S klogd -n
4824 admin 4788 S telnetd -m 0
4825 admin 4792 R telnetd -m 0
4872 admin 1560 S sh -c ps
4873 admin 1564 R ps
Код: Выделить всё
>sysinfo
Number of processes: 76
1:08am up 1:08,
load average: 1 min:1.39, 5 min:1.35, 15 min:1.33
total used free shared buffers
Mem: 125644 70064 55580 0 0
Swap: 0 0 0
Total: 125644 70064 55580
Код: Выделить всё
> df
Filesystem 1024-blocks Used Available Use% Mounted on
mtd:rootfs 15344 13884 1460 90% /
mtd:data 1024 84 940 8% /data
С благодарностью приму помощь в решении/поиске истоков проблемы.