aankondigingen:2021:c2021d14-storage-onderhoud-202110

C2021D14 Storage Onderhoud

Aankondiging: Storage onderhoud hosting omgeving

Beste klant/collega,

(Is dit bericht niet goed leesbaar? Bekijk dan de online versie.)

Wij vragen aandacht voor het volgende:

  1. Storage onderhoud

In de nachten van 10 op 11, 12 op 13 en 14 op 15 oktober 2021 wordt er tussen 2:00AM en 4:00AM onderhoud gepleegd aan de NPO storage omgeving. Gevolg hiervan is dat de hosting omgeving eenmalig gedurende enkele minuten een tragere storage zal ervaren, waardoor websites misschien even haperen.

Dit bericht is ter informatie, van uw kant is geen actie nodig.

Wat gaan we doen

De NPO storage omgeving is gerepliceerd over twee datacenters. Qua netwerk zitten de storage servers in datacenter 1 gekoppeld aan de core router in datacenter 1 en analoog voor datacenter 2. Met ingang van volgende week worden er ook kruisverbindingen gemaakt, waardoor de storageservers in datacenter 1 ook gekoppeld worden aan de core router in datacenter 2 en vice versa. Het voordeel hiervan is dat er dan voortaan onderhoud aan de netwerkapparatuur (de “core routers”) plaats kan vinden zonder dat dat nog impact heeft op de storage servers.

Om die kruislingse aansluitingen te kunnen maken is het nodig dat de storage servers iets anders aangesloten worden. Dit gebeurt datacenter voor datacenter, waarbij we ervoor zorgen dat tijdens onderhoud in datacenter 1 de volledige storage workload op de storageserver in datacenter 2 draait en vice versa. Het omschakelen van die storage workload kan zorgen voor enkele minuten tragere storage.

Wat is de impact

De storage oplossing die NPO heeft staan is op basis van een Hitachi HNAS. In dit systeem is het zo dat de workloads via een zgn “EVS Migrate” actie gemigreerd kunnen worden tussen verschillende storage servers. Tijdens die migratie wordt het IP adres waarlangs de storage benaderd wordt op de ene server down gebracht en op de andere server weer up gebracht. De clients (die een storage protocol genaamd NFS gebruiken) zien dat als het verbreken van een verbinding. Die verbindingen worden automatisch weer hersteld, maar voordat dat gebeurt wacht het protocol op een timeout om te voorkomen dat een nog levende, maar beetje trage verbinding ten onrechte verbroken zou worden. (“Is de verbinding echt weg? Nog even goed kijken hoor… Yep, as dead as a doornail. Nou dan maar weer een nieuwe verbinding maken”) Gedurende dat overschakelmoment ervaren de applicaties dat de storage even niets doet. Als ze iets proberen te lezen of te schrijven dan zit de applicatie in feite gewoon te wachten tot de storage weer tot leven is gekomen. Een lees of schrijfactie die normaal enkele milliseconden zal kosten heeft nu enkele tientallen seconden gekost. Dat is eenmalig tijdens het overschakelmoment en daarna draait alles gewoon weer door.

Bereikbaarheid

Team Hosting&Streaming is gedurende het onderhoud via de normale kanalen bereikbaar. Zie de contact pagina

  • aankondigingen/2021/c2021d14-storage-onderhoud-202110.txt
  • Last modified: 2024/03/07 17:08
  • by 127.0.0.1