UDM Pro instabiel

Thorarin

UniFier
21 jul 2021
7
1
3
Helaas weet ik niet wanneer het exact is begonnen, maar mijn UDM Pro is al enige tijd erg instabiel. Op dit moment draai ik versie 1.11.4 en ik ben - voor nu - voornamelijk benieuwd of mensen soortgelijke problemen ervaren.
  • De UDM Pro raakt om de haverklap de internetverbinding tijdelijk kwijt, ook al is er niks mis met de internetverbinding zelf.
    (Dat weet ik, omdat ik een IPv4 range heb en the UDM Pro maar één van de IPv4 adressen gebruikt. Andere apparaten blijven gewoon verbonden)
  • Met enige regelmaat staat er een melding op het display dat ik de UDM Pro moet herstarten of recovery mode moet gebruiken.
Hier een relevant stuk log van beide problemen, in een tijdspanne van 20 minuten:

Code:
May 30 18:22:52 ubnt user.info ubios-udapi-server: ubios-udapi-server: dpinger: path MY.WAN.IP.ADDRESS -> 8.8.8.8 is up. {"alarm":false,"id":"eth8-mon4-8.8.8.8","latencyAverage":13508.0,"latencyS
tdDev":0.0,"lossPercentage":0.0}
May 30 18:22:52 ubnt user.info ubios-udapi-server: ubios-udapi-server: dpinger: path MY.WAN.IP.ADDRESS -> 1.1.1.1 is up. {"alarm":false,"id":"eth8-mon4-1.1.1.1","latencyAverage":18665.0,"latencyS
tdDev":0.0,"lossPercentage":0.0}
May 30 18:22:54 ubnt local5.warn udapi-bridge[1417]: Received unknown event 'wanFailover'
May 30 18:22:56 ubnt user.info ubios-udapi-server: ubios-udapi-server: Got process exit event for process EVT_GW_WANTransition448
May 30 18:22:56 ubnt user.info ubios-udapi-server: ubios-udapi-server: Got process exit event for process EVT_GW_WANTransition449
May 30 18:23:35 ubnt daemon.warn dnsmasq-dhcp[1814]: no address range available for DHCP request via br0
May 30 18:23:37 ubnt daemon.warn dnsmasq-dhcp[1814]: no address range available for DHCP request via br0
May 30 18:23:44 ubnt daemon.warn dnsmasq-dhcp[1814]: no address range available for DHCP request via br0
May 30 18:24:16 ubnt user.notice dpi-flow-stats: ubnt-dpi-util: wifi disconnected while capturing | 00:bb:60:69:42:2c
May 30 18:24:39 ubnt daemon.warn dnsmasq-dhcp[1814]: no address range available for DHCP request via br0
May 30 18:24:39 ubnt daemon.warn dnsmasq-dhcp[1814]: no address range available for DHCP request via br0
May 30 18:25:10 ubnt user.notice dpi-flow-stats: ubnt-dpi-util: couldn't find mac 04:42:1a:09:9e:b6 when applying ml model
May 30 18:39:28 ubnt user.info ubios-udapi-server: ubios-udapi-server: dpinger: path MY.WAN.IP.ADDRESS -> 8.8.8.8 is down. {"alarm":true,"id":"eth8-mon4-8.8.8.8","latencyAverage":12446.0,"latency
StdDev":3165.0,"lossPercentage":52.63159942626953}
May 30 18:39:28 ubnt user.info ubios-udapi-server: ubios-udapi-server: dpinger: path MY.WAN.IP.ADDRESS -> 1.1.1.1 is down. {"alarm":true,"id":"eth8-mon4-1.1.1.1","latencyAverage":13152.0,"latency
StdDev":4388.0,"lossPercentage":52.63159942626953}
May 30 18:39:30 ubnt local5.warn udapi-bridge[1417]: Received unknown event 'wanFailover'
May 30 18:39:31 ubnt user.info ubios-udapi-server: ubios-udapi-server: Got process exit event for process EVT_GW_WANTransition451
May 30 18:39:31 ubnt user.info ubios-udapi-server: ubios-udapi-server: Got process exit event for process EVT_GW_WANTransition450
May 30 18:41:14 ubnt daemon.warn dnsmasq-dhcp[1814]: no address range available for DHCP request via br0
May 30 18:41:30 ubnt daemon.warn dnsmasq-dhcp[1814]: no address range available for DHCP request via br0
May 30 18:41:30 ubnt daemon.warn dnsmasq-dhcp[1814]: no address range available for DHCP request via br0
May 30 18:41:46 ubnt user.notice dpi-flow-stats: ubnt-dpi-util: wifi disconnected while capturing | 00:bb:60:69:42:2c
May 30 18:41:49 ubnt user.info ubios-udapi-server: ubios-udapi-server: Unable to resolve hostname for neighbor fe00::: Host not found (non-authoritative), try again later
May 30 18:42:01 ubnt user.notice dpi-flow-stats: ubnt-dpi-util: couldn't find mac 00:50:b6:f1:4b:fd when applying ml model
May 30 18:43:25 ubnt user.info ubios-udapi-server: ubios-udapi-server: wanFailover: Could not resolve ping.ubnt.com
May 30 18:43:25 ubnt user.info ubios-udapi-server: ubios-udapi-server: Got process exit event for process eth8-mon3-8.8.8.8
May 30 18:43:25 ubnt user.info ubios-udapi-server: ubios-udapi-server: Got process exit event for process eth8-mon3-1.1.1.1
May 30 18:43:25 ubnt user.info ubios-udapi-server: ubios-udapi-server: Got process exit event for process eth8-mon4-1.1.1.1
May 30 18:43:25 ubnt user.info ubios-udapi-server: ubios-udapi-server: Got process exit event for process eth8-mon4-8.8.8.8
May 30 18:51:44 ubnt syslog.info syslogd started: BusyBox v1.31.1

Een paar dingen vielen me op:
  • Ik maak geen gebruik van WAN failover, wellicht verklaart dat de 'unknown event' meldingen?
  • Wat zijn die DHCP requests via br0? Ik gebruik een statisch WAN IP-adres.
  • Tegen het einde van het log vallen er meerdere processen om. Ik denk dat op dat moment die melding ook op het display verschijnt.
Hebben meer mensen last van dit soort instabiliteit momenteel?
Op dit moment gebruik ik m'n UDM Pro nog steeds niet als router, mede hierdoor. Voornamelijk voor camera-opnames en als controller voor overige netwerkapparatuur.
 
Ik zou toch de laatste EA firmware versie 1.12.22 versie proberen. Die lost toch al heel veel problemen op. Als je geen EA versie wilt zul je nog even geduld moeten hebben.
 
Als ik dit geef jij dus aan, in je hoofd omgeving (productie) gewoon updaten naar de EA omdat ze stabiel zijn?
Deze versie 1.12.22 is idd stabiel. Heb daar nul problemen.
Wil niet zeggen dat alle EA's goed zijn.
Van alle EA's heb ik er ooit eens 2 gehad die niet helemaal lekker liepen.
Bij klanten gebruik ik ze nooit, tenzij het wellicht een probleem zou op kunnen lossen.
 
Kleine update:

Na installatie van 1.12.22 werkt m'n UDM Pro iets betrouwbaarder, maar er wordt nog steeds met enige regelmaat gemeld dat de internetverbinding down is, terwijl dit niet het geval is.

Wat me is opgevallen, dat het message log I/O fouten bevat, meestal minder dan 30 seconden voordat de UDM Pro concludeert dat de verbinding down is.
Bijvoorbeeld:

Code:
Jun  3 09:58:10 ubnt user.err ubios-udapi-server: process: Failed to read file, errno=Interrupted system call eintr_cnt=1 ferror=1 attempt=1
Jun  3 10:01:26 ubnt user.info ubios-udapi-server: wan-failover-monitor-icmp: WAN Failover Monitors (eth8/213.125.209.52) wf-monitor (#7) has dpinger update: 1.1.1.1/ping.ubnt.com is down {"alarm":true,"id":"eth8-mon7-1.1.1.1-ping.ubnt.com","latencyAverage":168350.0,"latencyStdDev":124097.0,"lossPercentage":52.63159942626953}
Jun  3 10:01:26 ubnt user.info ubios-udapi-server: wan-failover-monitor-icmp: WAN Failover Monitors (eth8/213.125.209.52) wf-monitor (#7) has dpinger update: 8.8.8.8/ping.ubnt.com is down {"alarm":true,"id":"eth8-mon7-8.8.8.8-ping.ubnt.com","latencyAverage":10765.0,"latencyStdDev":2659.0,"lossPercentage":52.63159942626953}
Jun  3 10:01:27 ubnt user.info ubios-udapi-server: wan-failover-groups: WAN Failover Groups is using eth8 (table 201), eth8 is down [_d___], eth9 is down (no ip)[ddddd]1

Soms komen ze ook los voor:

Code:
Jun  3 10:16:45 ubnt user.err ubios-udapi-server: process: Failed to read file, errno=Interrupted system call eintr_cnt=1 ferror=1 attempt=1
Jun  3 10:17:59 ubnt user.err ubios-udapi-server: process: Failed to read file, errno=Interrupted system call eintr_cnt=1 ferror=1 attempt=1
Jun  3 10:18:36 ubnt user.err ubios-udapi-server: process: Failed to read file, errno=Interrupted system call eintr_cnt=1 ferror=1 attempt=1

Ik heb geen idee over welke file of welk filesysteem het hier gaat, en waarom de file niet gelezen kan worden, maar "Interrupted system call" klinkt niet heel goed. Als leesacties bijvoorbeeld timeouts opleveren, zou dat wel kunnen betekenen dat processen voor bijvoorbeeld 15 of 30 seconden geblokkeerd staan, waardoor dus mogelijk ook de conclusie getrokken kan worden dat de internetverbinding niet reageert.

Ik heb een harde schijf geinstalleerd voor video-opnames, maar de SMART data van die schijf geeft aan dat er geen read errors zijn geweest of andere dingen die wijzen naar problemen met deze schijf.
 
Activiteit
Er wordt op dit moment (nog) geen nieuwe reactie gepost.
  Topic Status: Hallo . Er is al meer dan 14 dagen geen nieuwe reactie meer geplaatst.
  De inhoud is mogelijk niet langer relevant.
  Misschien is het beter om in plaats daarvan een nieuw onderwerp te starten..