Project tardigrade beschermt uw vms tegen hostfouten

Inhoudsopgave:

Video: Dodging an Orbital while Going Down? | Project Tardigrade #2 2024

Video: Dodging an Orbital while Going Down? | Project Tardigrade #2 2024
Anonim

Na meerdere Azure-wijzigingen en beveiligingsverbeteringen in de afgelopen maanden, introduceert Microsoft Project Tardigrade als hun nieuwste poging om Azure betrouwbaarder te maken.

Project Tardigrade voorkomt platformfouten

Project Tardigrade is een nieuwe service die de veerkracht van Azure wil verbeteren. Het omvat mitigatiestrategieën die Azure VM's beschermen tegen platformfouten.

Dit is hoe Mark Russinovich, Chief Technology Officer bij Microsoft Azure, het huidige werk aan Azure beschrijft:

Ons doel is organisaties in staat te stellen hun workloads betrouwbaar op Azure uit te voeren. Met dit als leidraad, investeren we continu in het ontwikkelen van het Azure-platform om foutbestendig te worden, niet alleen om de bedrijfsproductiviteit te verhogen, maar ook om een ​​naadloze klantervaring te bieden.

Om impact op uw workloads te voorkomen, stelt de service componenten in staat zichzelf te genezen en snel te herstellen van mogelijke storingen, zelfs bij kritieke hostfouten.

Hoe werkt Project Tardigrade?

Hier is een voorbeeld van hoe de herstelwerkstroom van Tardigrade werkt:

  • Fase 1: deze stap heeft geen invloed op het uitvoeren van VM's van klanten. Het recycleert eenvoudig alle services die op de host worden uitgevoerd. In het zeldzame geval dat de defecte service niet succesvol herstart, gaan we verder met fase 2.
  • Fase 2: Onze diagnoseservice wordt op de host uitgevoerd om alle relevante logboeken / dumps systematisch te verzamelen, om ervoor te zorgen dat we de oorzaak van de storing in fase 1 grondig kunnen diagnosticeren. Met deze uitgebreide analyse kunnen we het probleem 'root-oorzaak' en herhaling voorkomen. in de toekomst.
  • Fase 3: Op een hoog niveau resetten we het besturingssysteem naar een gezonde staat met minimale impact voor de klant om het hostprobleem te verminderen. Tijdens deze fase behouden we de toestanden van elke VM tot RAM, waarna we het OS in een gezonde toestand beginnen te resetten. Terwijl het besturingssysteem eronder snel wordt gereset, worden toepassingen op alle VM's die op de server worden gehost kort 'bevroren' omdat de CPU tijdelijk wordt onderbroken. Deze ervaring is vergelijkbaar met een tijdelijk verbroken netwerkverbinding, maar wordt snel hervat vanwege logica voor opnieuw proberen. Nadat het besturingssysteem met succes is gereset, verbruiken VM's hun opgeslagen status en hervatten ze normale activiteit, waardoor potentiële VM-herstarts worden omzeild.

Met dit in gedachten, zal Project Tardigrade ervoor zorgen dat het falen van een enkel component in de host niet het hele systeem beïnvloedt. Als zodanig worden VM's van klanten niet beïnvloed door hostfouten.

Microsoft werkt er hard aan om de verschillende scenario's voor hostfouten te verbeteren en uit te breiden om ervoor te zorgen dat hun cloud computing-platform betrouwbaarder is dan ooit.

Verwacht in de nabije toekomst nieuwe ontwikkelingen en andere implementaties van betrouwbaarheid.

Project tardigrade beschermt uw vms tegen hostfouten