aankondigingen:2022:c2022d03-storage-onderhoud-202203

C2022D03 Storage Onderhoud

Aankondiging: Storage onderhoud hosting omgeving

Beste klant/collega,

(Is dit bericht niet goed leesbaar? Bekijk dan de online versie.)

Wij vragen aandacht voor het volgende:

  1. Storage onderhoud

In de nacht van dinsdag 1 maart op woensdag 2 maart wordt er onderhoud gepleegd aan de NPO Storage omgeving.

Wat gaan we doen

Er worden firmware upgrades van de NAS omgevingen uitgevoerd. Het schema ziet er als volgt uit:

datum tijd wat impact
nacht van dinsdag 1 op woensdag 2 maart1:00–2:00 hostingstorage NAS websites kunnen enkele malen gedurende enige minuten haperen
nacht van dinsdag 1 op woensdag 2 maart 2:00–3:00 mediastorage NAS geen impact verwacht

Aanleiding/ achtergrond

De NPO storage omgeving bestaat uit twee functionele hoofdcomponenten, te weten een SAN1) en een NAS2). Misschien heb je thuis wel een NAS systeempje staan om je foto's op te bewaren of om films of muziek mee af te spelen. De NAS systemen bij de NPO zijn de grote broertjes daarvan. In een NAS zit normaal een of meerdere harddisks waar de bestanden uiteindelijk opgeslagen worden. Het grote broertje van een losse harddisk is een SAN, dat is een hele verzameling van harddisks die via een storage netwerk aan b.v. een NAS beschikbaar gemaakt worden.

Voor zowel SAN als NAS systemen geldt dat deze ingebakken software hebben (zogeheten “firmware”) en die firmware moet van tijd tot tijd bijgewerkt worden naar een nieuwere versie waarin bugs opgelost zijn.

In deze ronde worden de NAS systemen van een half-jaarlijkse upgrade voorzien. De SAN systemen volgen in een latere ronde, dat kan zonder impact.

Impact

Voor de NAS systemen geldt dat deze elk als clusters bestaande uit twee nodes draaien. Een firmware upgrade gebeurt node voor node. Tijdens de upgrade van de ene node wordt de gehele workload tijdelijk even door de andere node gedaan, waarna de workload weer eerlijk over beide nodes verdeeld kan worden. Het omschakelen van workload tussen de nodes duurt ongeveer 10 seconden tot een minuut. Tijdens zo'n omschakeling staat het ophalen en wegschrijven van bestanden even stil. In geval van websites en apps kan dat betekenen dat deze tijdelijk een timeout geven. Omdat er gedurende de nacht meerdere van dit soort overschakelmomenten nodig zijn kunnen dit soort timeouts een aantal malen gedurende de nacht plaatsvinden, maar ze zouden per keer nooit langer dan enige seconden tot een minuut mogen duren.

Voor de mediastorage NAS geldt dat deze bijna niets meer doet, omdat tegenwoordig de meeste content via een ander CDN wordt uitgespeeld. De rest-content die bv nog via content.omroep.nl wordt uitgespeeld bevindt zich grotendeels in lokale on-disk caches van de uitspeelservers, waardoor de upgrade van de mediastorage NAS zonder impact kan gebeuren. Toch doen we dat de mediastorage NAS systemen deze ronde 's nachts, omdat er eerder een storing met een van deze systemen is geweest en we het change moment aangrijpen om te testen of het overfailen van de workload nu wel goed gaat.

Bereikbaarheid

Team Hosting&Streaming is gedurende het onderhoud via de normale kanalen bereikbaar. Zie de contact pagina


1)
Storage Area Network
2)
Network attached Storage
  • aankondigingen/2022/c2022d03-storage-onderhoud-202203.txt
  • Last modified: 2024/04/16 07:59
  • by 127.0.0.1