aankondigingen:2020:c2020a03-storage-onderhoud-202005

C2020A03 Storage Onderhoud

Aankondiging: Storage onderhoud hosting omgeving

Beste klant/collega,

(Is dit bericht niet goed leesbaar? Bekijk dan de online versie.)

Wij vragen aandacht voor het volgende:

  1. Storage onderhoud

In de periode van 12 t/m 17 mei wordt er onderhoud gepleegd aan de NPO Storage omgeving.

Wat gaan we doen

Deze week worden firmware upgrades van zowel de SAN als de NAS omgevingen uitgevoerd. Het schema ziet er als volgt uit:

datum tijd wat impact
nacht van dinsdag 12 op woensdag 13 mei 1:00–4:00 mediastorage NAS uitserveren van media content kan enkele malen gedurende enige minuten haperen
nacht van woensdag 13 op donderdag 14 mei 1:00–4:00 hostingstorage NAS websites kunnen enkele malen gedurende enige minuten haperen
zaterdag 16 mei 9:00–16:00 SAN (locatie 1) geen impact verwacht
zondag 17 mei 9:00–16:00 SAN (locatie 2) geen impact verwacht

Aanleiding/ achtergrond

De NPO storage omgeving bestaat uit twee functionele hoofdcomponenten, te weten een SAN1) en een NAS2). Misschien heb je thuis wel een NAS systeempje staan om je foto's op te bewaren of om films of muziek mee af te spelen. De NAS systemen bij de NPO zijn de grote broertjes daarvan. In een NAS zit normaal een of meerdere harddisks waar de bestanden uiteindelijk opgeslagen worden. Het grote broertje van een losse harddisk is een SAN, dat is een hele verzameling van harddisks die via een storage netwerk aan b.v. een NAS beschikbaar gemaakt worden.

Voor zowel SAN als NAS systemen geldt dat deze ingebakken software hebben (zogeheten “firmware”) en die firmware moet van tijd tot tijd bijgewerkt worden naar een nieuwere versie waarin bugs opgelost zijn. In de firmware die op dit moment gebruikt wordt blijken een aantal kritieke bugs te zitten waarom het van belang is deze firmware upgrades met enige spoed uit te voeren,.

Impact

Voor de NAS systemen geldt dat deze elk als clusters bestaande uit twee nodes draaien. Een firmware upgrade gebeurt node voor node. Tijdens de upgrade van de ene node wordt de gehele workload tijdelijk even door de andere node gedaan, waarna de workload weer eerlijk over beide nodes verdeeld kan worden. Het omschakelen van workload tussen de nodes duurt ongeveer 10 seconden tot een minuut. Tijdens zo'n omschakeling staat het ophalen en wegschrijven van bestanden even stil. In geval van websites en apps kan dat betekenen dat deze tijdelijk een timeout geven. Omdat er gedurende de nacht meerdere van dit soort overschakelmomenten nodig zijn kunnen dit soort timeouts een aantal malen gedurende de nacht plaatsvinden, maar ze zouden per keer nooit langer dan enige seconden tot een minuut mogen duren.

De SAN systemen werken iets anders. Deze zijn intern redundant. Dat betekent dat een firmware upgrade uitgevoerd kan worden zonder dat de buitenwereld daar veel van merkt. Tijdens de upgrade ligt de verwerkingscapaciteit van het SAN ongeveer 10-20% lager dan normaal, maar omdat het SAN in z'n geheel voor minder dan 60% belast wordt verwachten we dat deze upgrades geen merkbare impact gaan hebben.

Bereikbaarheid

Team Hosting&Streaming is gedurende het onderhoud via de normale kanalen bereikbaar. Zie de contact pagina


1)
Storage Area Network
2)
Network attached Storage
  • aankondigingen/2020/c2020a03-storage-onderhoud-202005.txt
  • Last modified: 2020/10/17 11:12
  • (external edit)