aankondigingen:2021:c2021d14-netwerk-onderhoud3-202110

C2021D14 Netwerk Onderhoud, deel 3

Aankondiging: Netwerk onderhoud hosting omgeving

Beste klant/collega,

(Is dit bericht niet goed leesbaar? Bekijk dan de online versie.)

Wij vragen aandacht voor het volgende:

  1. Netwerk onderhoud

In de nacht van 21 op 22 oktober wordt er tussen 1:00AM en 3:00AM onderhoud gepleegd aan delen van de NPO hosting omgeving. Eerst wordt een hosting blade enclosure aangesloten op de nieuwe netwerk aggregatielaag, als dat slaagt worden daaraansluitend de hosting serverinstances, zowel redundant (webservers) als non-redundant (databases) weer terugverhuisd naar dit blade enclosure. Dit bericht is ter informatie, van uw kant is geen actie nodig. Military Helmet

Wat gaan we doen

In een eerder bericht gaven we aan dat een alle hosting diensten wegverhuisd gingen worden van een van onze blade enclosures. Dat is probleemloos gegaan. De bedoeling was dat dit blade enclosure dan zonder impact overgezet zou kunnen wordn op de nieuwe netwerk aggregatielaag, want er zouden dan immers geen diensten op draaien. Helaas heeft de nieuwe netwerk aansluiting toch tot een verstoring geleid en is die actie teruggedraaid.

Inmiddels is duidelijk wat er mis is gegaan en zullen onze collega's van team IAAS een tweede poging ondernemen om het blade enclosure om te zetten naar de nieuwe aggregatielaag.

Als die actie slaagt dan worden alle server instances die in de vorige wijziging zijn wegverhuisd weer terugverhuisd naar dit blade enclosure.

Wat is de impact

Deze actie valt in 2 stukken uiteen:

  1. een netwerk change, waarbij een blade enclosure anders aangesloten wordt
  2. een hosting change waarbij server instances terugverhuisd worden.

De impact van de eerste (netwerk) change is hopelijk nihil, want het betrokken blade enclosure wordt op dat moment niet actief gebruik. Maar, er is dus een kans dat hetzelfde probleem (verkeer dat in een loop raakt, waardoor de core routers ingrijpen en al het verkeer blokkeren) optreedt, waardoor de gehele hosting omgeving tijdelijk niet bereikbaar kan zijn. Als dit gebeurt dan kunnen de wijzigingen snel ongedaan gemaakt worden, waardoor de downtime naar verwachting beperkt zal blijven tot minder dan 1 minuut.

De impact van de tweede (hosting) change is vergelijkbaar met de actie van 19-20 oktober, instances moeten gestopt worden op de ene server en weer gestart op een andere server. Per instance kost dit ongeveer 30 seconden tot enkele minuten (afhankelijk van het type instantie; een database start snel op, java kan er wat langer over doen) Gedurende die tijd is de instantie niet beschikbaar voor websites. Bij deze change worden ook de wel-redundante instances meegenomen (webservers, applicatieservers, elastic search instances). Omdat deze geloadbalanced zijn heeft het verplaatsen van dit type instances geen impact.

Bereikbaarheid

Team Hosting&Streaming is gedurende het onderhoud via de normale kanalen bereikbaar. Zie de contact pagina

  • aankondigingen/2021/c2021d14-netwerk-onderhoud3-202110.txt
  • Last modified: 2024/04/16 07:59
  • by 127.0.0.1