Wie lässt sich Cloud Waste mit AWS Auto Scaling reduzieren?

Ursprünglich publiziert: May 09, 2024 Aktualisiert: July 11, 2024 Dauer 10 Min.

Die Umstellung auf die Cloud kann für Unternehmen kostspielig sein, und im ungünstigsten Fall kommen zu den notwendigen Ausgaben noch weitere Kosten hinzu. Eine Umfrage von Virtana hat gezeigt, dass 82 % der Befragten unnötige Cloud-Kosten hatten, und 56 % fehlten Werkzeuge, um ihre Ausgaben gezielt zu verwalten. 86 % können sich nur schwer einen Gesamtüberblick über alle damit verbundenen Ausgaben verschaffen.

Einer der Gründe für die hohen Kosten bei der Cloud-Einführung ist der sogenannte Cloud Waste. Diese Kostenkategorie wirkt sich auf die TCO und die Betriebskosten während des gesamten Lebenszyklus der Cloud-Lösung aus. 42 % der Befragten sehen eskalierende Kosten als Hauptgrund für die Rückverlagerung von Workloads aus der Cloud in eine lokale Infrastruktur.

In diesem Artikel konzentrieren wir uns auf Amazon Auto Scaling – ein Tool zur effektiven Bewältigung von Cloud Waste bei Anwendungen, die auf Amazon Web Services basieren. Erfahren Sie, wie Sie die Cloud-Ressourcen effektiv verwalten, welchen Ansatz Sie je nach den spezifischen technischen Anforderungen wählen sollten und wie Sie AWS Auto Scaling in 3 Schritten einführen.

Was ist AWS Auto Scaling?

AWS Auto Scaling ist ein robuster Service von Amazon Web Services (AWS), der die automatische Verwaltung und Anpassung der Kapazität Ihrer AWS-Ressourcen unterstützt, um eine optimale Leistung und Kosteneffizienz für Ihre Anwendungen zu gewährleisten. Das Tool ermöglicht die Definition von Skalierungsrichtlinien und den Einsatz prädiktiver Skalierung, um sicherzustellen, dass die richtige Menge an Ressourcen im System verwendet wird, sowohl bei Unter- als auch bei Überversorgung.

Der Service bietet eine intuitive Benutzeroberfläche, die die Erstellung von Skalierungsplänen für verschiedene Ressourcen erleichtert, darunter EC2-Instances und Spot Fleets, Amazon ECS-Tasks, Amazon DynamoDB-Tabellen und -Indizes sowie Amazon Aurora Replicas. Die wichtigsten Merkmale des Services sind:

Eine vereinheitlichte Skalierung: Hierbei erfolgt die Einrichtung einer automatischen Skalierung für alle skalierbaren Ressourcen, die zur Ausführung Ihrer Anwendung verwendet werden, über eine einzige Schnittstelle.
Automatische Ressourcenerkennung durch die Umgebung, ohne dass die zu skalierenden Ressourcen manuell identifiziert werden müssen.
Integrierte Skalierungsstrategien: Sie können sich für eine von drei vordefinierten Strategien entscheiden, die sich auf die Optimierung der Kosten, der Leistung oder ein Gleichgewicht zwischen beidem konzentrieren. Darüber hinaus ist es möglich, die benutzerdefinierten Zielparameter für eine Skalierungsstrategie zu verwenden, die vollständig auf die Bedürfnisse des Projekts zugeschnitten ist.
Prädiktive Skalierung: Das Tool kann künftige Traffic-Schwankungen vorhersagen und die richtige Anzahl von EC2-Instanzen bereitstellen und so die prognostizierten Änderungen berücksichtige
Transparente Verwaltung: Amazon Auto Scaling erstellt zielführende Skalierungsrichtlinien für alle Ressourcen im Skalierungsplan. Darüber hinaus bietet es Alarme, die bei Bedarf Skalierungsanpassungen für jede Ressource auslösen.
Intelligente Skalierungsmaßnahmen: Das Tool berechnet fortlaufend die erforderlichen Skalierungsanpassungen, um die Kapazität zu erhöhen oder zu verringern, wenn dies zur Aufrechterhaltung Ihrer Zielkennzahlen erforderlich ist.

Amazon Auto Scaling ist für AWS-Kunden kostenlos verfügbar, und die Kunden können damit die AWS-Ressourcen verwalten, auf denen ihre Projekte laufen. Aus der Unternehmensperspektive ist es ein leistungsfähiges Optimierungswerkzeug, mit dem sichergestellt werden kann, dass die richtigen Cloud-Ressourcen genutzt werden. Außerdem kann es dazu beitragen, das Kostenmanagement zu verbessern und die Skalierung zu automatisieren.

Wann braucht Ihr Unternehmen Amazon Auto Scaling?

Die Vorteile der Einführung von AWS Auto Scaling

Source

Es gibt drei Hauptgründe für die Einführung von Amazon Auto Scaling – Verbesserung der Kapazität Ihrer Anwendung, ihrer Leistung oder die Optimierung der Kosten durch Reduzierung von Cloud Waste. Es geht nicht darum, alle Netzressourcen zu skalieren: AWS Auto Scaling ist für die Skalierung von Ressourcen gedacht, die für den Betrieb von Anwendungen wie z. B. virtuelle Maschinen, Datenbanken und andere.

Hier sind die technischen Fälle, in denen AWS Auto Scaling einen greifbaren Nutzen bringt:

Kostenoptimierung: Mit Auto Scaling können Sie die Ressourcenzuweisung an den tatsächlichen Bedarf anpassen, ohne dass Cloud-Ressourcen verschwendet werden.
Bewältigung schwankender Workloads: AWS Auto Scaling sorgt für automatische Anpassungen, um regelmäßige Änderungen am Workload zu bewältigen. Sie können zum Beispiel ein stündliches System für die Verwaltung von Datenlasten einrichten, die sich zu verschiedenen Zeiten unterscheiden.
Saisonale Spitzenwerte: Wenn Ihre Anwendung saisonale Nutzungsspitzen aufweist (während der Ferien oder bei bestimmten Ereignissen), sollten Sie die erhöhte Datenlast während dieser Zeiträume auffangen und danach automatisch herunterfahren, um Kosten zu sparen.
Verbesserte Leistung: Die automatische Ressourcenskalierung führt zu einer besseren Anwendungsleistung, indem sie sicherstellt, dass zu jedem Zeitpunkt die richtige Menge an Ressourcen verfügbar ist. Auf diese Weise verhindern Sie eine Unterversorgung, die zu Leistungsengpässen führt.
Erhöhte Zuverlässigkeit: Durch die automatische Verteilung von Workloads auf mehrere Instanzen verringern Sie das Risiko von Ausfallzeiten erheblich. Außerdem erkennt Auto Scaling die Beendigung der EC2-Instanz aufgrund eines Systemfehlers oder Hardwareausfalls und ersetzt sie automatisch, um Ausfallzeiten zu vermeiden.
Geringere manuelle Eingriffe: Das automatische Kapazitätsmanagement macht die manuelle Überwachung von Kennzahlen und Kapazitätsanpassungen rund um die Uhr überflüssig, verringert das Risiko menschlicher Fehler und senkt die Personalkosten.
Umgang mit unvorhersehbaren Latenzzeiten: Die automatische Skalierung stellt sicher, dass Sie die erhöhte Nachfrage ohne Serviceunterbrechungen bewältigen können – zum Beispiel, wenn die Datenlast aufgrund von Marketingkampagnen oder viralen Inhalten plötzlich stark ansteigt.
Resilienz: Das Tool ermöglicht eine Skalierung, wenn Ihr Unternehmen expandiert, ohne dass Sie Ihre Infrastruktur komplett überarbeiten müssen.

Das Wesentliche bei der Einführung von AWS Auto Scaling ist die dynamische, zukunftssichere Anpassungsfähigkeit an die sich ändernden Workloads. Im Vergleich zur manuellen Skalierung bedeutet dieses Tool aufgrund der Automatisierung der Überwachung und der Benachrichtigung über Änderungen einen deutlich geringeren Arbeitsaufwand. Als Ergebnis erhalten Sie ein effizientes Tool für den Ressourcenausgleich, das in der Lage ist, Änderungen des Anwendungsbedarfs rechtzeitig zu bewältigen.

Komponenten von Amazon Auto Scaling

Die automatische Verwaltung der Ressourcen des Server-Clusters in AWS Auto Scaling wird durch verschiedene Mechanismen ermöglicht. Sie bieten Flexibilität bei der Konfiguration der CPU- und anderer Ressourcennutzungsgrade. Wenn der Schwellenwert erreicht ist, skaliert das Tool die Ressourcen automatisch hoch. Wenn die Last unter den vordefinierten Schwellenwert sinkt, fährt das System automatisch die Standardkonfiguration herunter.

Zu den Komponenten, die an Amazon Auto Scaling mitwirken, gehören die folgenden:

AMI (Amazon Machine Image): Dies ist ein Abbild einer EC2-Instanz, die für die Ausführung Ihrer Anwendungen konfiguriert ist. Dabei handelt es sich um ein identisches ausführbares Abbild des Systems, das zur Erstellung neuer Abbilder und zum Start neuer Instanzen zu Skalierungszwecken verwendet werden kann.
Load Balancer: Dieses Element regelt die Aufteilung der Arbeitslast auf die Instanzen. Es kann automatisch die Lasten definieren und Anfragen basierend auf den vordefinierten Regeln an die Instanzen mit weniger Last umleiten. Klassische Load Balancer verteilen den Datenverkehr gleichmäßig auf alle aktivierten Instanzen. Anwendungs-Load-Balancer leiten den Datenverkehr auf der Grundlage einer Reihe von vordefinierten Regeln um. Die Wahl hängt von den spezifischen Projektanforderungen ab.
Snapshot: Dies ist eine Kopie der Daten auf Ihren Instanzen. Bei einem inkrementellen Snapshot der EC2-Instanz werden nur die Datenblöcke erfasst, die beim vorherigen Snapshot geändert wurden.
EC2-Instanz (Elastic Compute Cloud): Ein virtueller Server in der Elastic Compute Cloud (EC2), der für die Bereitstellung von Anwendungen in der AWS-Infrastruktur verwendet wird. Der Zugriff auf einen virtuellen Server erfolgt über eine SSH-Verbindung, um verschiedene Anwendungskomponenten zu installieren.
Sich automatisch skalierende Gruppen: Es handelt sich um eine Gruppe von EC2-Instanzen, die aus einem gemeinsamen Amazon Machine Image (AMI) erstellt wird. Sie verfügen in der Regel über ähnliche Konfigurationen und passen die Anzahl der Instanzen innerhalb der Gruppen automatisch an den Bedarf an und stellen sicher, dass die Gruppe ein bestimmtes Kapazitäts- und Leistungsniveau beibehält.

Alle diese Elemente sind so eingerichtet, dass AWS Auto Scaling aktiviert wird. Zunächst sollte ein AMI des Servers eines Benutzers erstellt werden. Nach dieser Erstellung wird die Konfiguration gestartet. Während der Konfiguration wird je nach Bedarf der passende Instanztyp ausgewählt. Nach dem Start der Konfiguration wird dann eine Auto-Scaling-Gruppe erstellt.

Wenn die Workloads steigen, initiiert der AWS Auto Scaling Service die Erstellung neuer EC2-Instanzen mit einer ähnlichen Konfiguration wie der Server und repliziert die Einstellungen aus dem AMI. Wenn der Datenverkehr gering ist, werden die überzähligen Instanzen entfernt. Bei jeder neuen Instanz, die erstellt wird, verteilt der Load Balancer die Arbeitslast auf die einzelnen Instanzen.

Skalierungsstrategie: Welche Strategie soll ich wählen?

AWS Auto Scaling kann so konfiguriert werden, dass die Anwendungsressourcen auf der Grundlage von Verfügbarkeit, Kosten oder einer Kombination aus beidem richtig skaliert werden:

Bei der Wahl Ihrer Skalierungsstrategie können Sie auch eine der verfügbaren Skalierungsarten auswählen:

Reaktiv: Bei dieser Skalierungsmethode wird die Anzahl der Instanzen manuell als Reaktion auf bestimmte Änderungen des Workloads geändert. In Fällen, in denen die Antwortzeit einen bestimmten Grenzwert überschreitet, passen wir beispielsweise die Kapazität (CPU oder Speicher) an. Im Vergleich zu anderen Skalierungsansätzen ist die reaktive Skalierung mit mehr Aufwand verbunden und erfreulicherweise in modernen Projekten weniger verbreitet.
Geplant: Hierbei handelt sich um eine automatische Skalierung nach einem bestimmten Zeitplan. Wenn beispielsweise eine Anwendung am Wochenende kaum genutzt wird, können Sie die Anzahl der EC2-Instanzen für den Zeitraum von Freitagabend bis Montagmorgen von fünf auf zwei reduzieren.
Dynamisch: Die dynamische Skalierung passt die Anzahl der EC2-Instanzen automatisch als Reaktion auf Signale von CloudWatch-Alarmen an. Dieser Ansatz wird in der Regel verwendet, um Schwankungen des Traffic-Aufkommens auszugleichen, insbesondere wenn dieses unvorhersehbar ist. Wenn beispielsweise die CPU-Auslastung 60 % übersteigt, wird eine weitere EC2-Instanz hinzugefügt. Wenn die CPU weniger als 40 % beträgt, wird die EC2-Instanz entfernt. Die dynamische Skalierung gilt als eine der effizientesten Methoden, die zwar vergleichsweise mehr Zeit für die Einrichtung benötigt, dafür aber weniger Aufwand bei Verwaltung und Wartung erfordert.
Prädiktiv: Bei dieser Methode werden Algorithmen des maschinellen Lernens eingesetzt, um die optimale Anzahl der Instanzen auf der Grundlage der erwarteten künftigen Verkehrsmuster vorherzusagen. Dieser Ansatz ist sinnvoll, wenn die Arbeitslast einem vorhersehbaren Muster folgt.

how-to-reduce-the-cloud-waste-with-aws-auto-scaling-de_scheme-6

Alle Skalierungsmethoden tragen dazu bei, den Einsatz von Cloud-Ressourcen zu optimieren und gleichzeitig die angestrebten Leistungsparameter einzuhalten. Sie alle zielen darauf ab, die Ressourcenverschwendung zu minimieren und damit die Gesamtprojektkosten zu senken. Jeder Ansatz entspricht spezifischen Anwendungsanforderungen und dem Charakter der Arbeitslastschwankungen, die die Wahl der am besten geeigneten Skalierungsmethode bestimmen.

Roadmap für die Einführung von Amazon Auto-Scaling

Die Implementierung von Amazon Auto Scaling umfasst eine Reihe von Schritten zur Konfiguration und Verwaltung aller Elemente entsprechend den spezifischen Anwendungsanforderungen und Geschäftszwecken. Hier finden Sie eine 3-stufige Roadmap für den Einstieg in Amazon Auto Scaling:

Analyse und Planung
- Analysieren Sie die Belastungsmetriken (CPU, Timing, Verbindung usw.): Vergleichen Sie z. B. die Werte für 30 Tage und definieren Sie Mindest- und Höchstwerte.
- Definieren Sie Skalierungsrichtlinien. Bei wöchentlichen oder stündlichen Lastspitzen können Sie eine geplante Skalierung wählen. Für schwierigere Fälle und vorhersehbare Veränderungen ist eine dynamische Skalierung vorzuziehen.
- Wählen Sie eine Konfiguration für eine Auto-Scaling-Gruppe aus (erstellen Sie einen neuen Launch Configurator oder wählen Sie einen vorhandenen).
- Definieren Sie die maximale und minimale Kapazität: Legen Sie die minimale und maximale Anzahl von Instanzen in der Auto-Scaling-Gruppe fest, um die Skalierungsgrenzen zu definieren.
Implementierung und Konfiguration
- Erstellen Sie eine Auto-Scaling-Gruppe, indem Sie die gewünschte Kapazität, Startkonfiguration, Verfügbarkeitszonen und andere Parameter festlegen.
- Konfigurieren Sie Skalierungsrichtlinien, indem Sie die Zielverfolgung, Stufenskalierung und geplante Aktionen festlegen.
- Definieren Sie Health Checks zur Überwachung des Status von Instanzen.
- Aktivieren Sie Cool-Down-Prioden, um schnelle, aufeinanderfolgende Skalierungsaktionen zu verhindern (optional).
Überwachung und Optimierung
- Überwachen Sie Ihre Auto-Scaling-Gruppe: Überwachen Sie kontinuierlich die Leistung Ihrer Gruppe und die Metriken, die Skalierungsmaßnahmen auslösen.
- Konfigurieren Sie Skalierungswarnungen/Benachrichtigungen: Verwenden Sie Amazon CloudWatch, um Alarme für wichtige Metriken einzurichten, die Sie bei Skalierungsereignissen warnen.
- Feinabstimmung der Skalierungsrichtlinien: Überprüfen und passen Sie Ihre Skalierungsrichtlinien regelmäßig an, um das Verhalten Ihrer Anwendung und Leistungsänderungen zu kontrollieren.
- Testen Sie Ihre Einrichtung: Simulieren Sie Skalierungsereignisse oder testen Sie Ihre Auto-Scaling-Einrichtung in einer Staging-Umgebung, um sicherzustellen, dass Ihre Richtlinien und Einstellungen korrekt funktionieren.
- Anpassung der Ressourcenzuweisung: Definieren Sie minimale und maximale Kapazitätsgrenzen, um die Ressourcenzuweisung zu optimieren und gleichzeitig mehr Daten über die Leistung Ihrer Anwendung zu erhalten.

Dieser Einführungsplan trägt dazu bei, Cloud Waste zu minimieren, indem er sicherstellt, dass Ihre Anwendung zuverlässig funktioniert und entsprechend an die sich ändernden Arbeitslasten angepasst werden kann.

Fazit

Cloud Waste ist einer der Hauptgründe für überhöhte Ausgaben und Misserfolge bei cloudbasierten Operationen. Amazon Auto Scaling hilft, Cloud Waste zu reduzieren, und zwar durch:

eine effiziente Ressourcennutzung
automatische Skalierungsmechanismen zur Anpassung an den aktuellen und zukünftigen Workload
die automatische Beendigung von unnötigen Instanzen
die Wartung des Lebenszyklus einer Instanz mit rechtzeitigen Zustandsprüfungen und Fehlererkennung
elastische Lastverteiler zur Verteilung von Arbeitslasten auf Instanzen

Infopulse ist offizieller Amazon-Partner mit zertifizierter Expertise in der Bereitstellung von professionellen Cloud-Services und -Lösungen auf der AWS-Plattform. Unsere Spezialisten helfen Ihnen, AWS Auto Scaling richtig einzurichten und den optimalen Skalierungsansatz für Ihre Anwendungsspezifika zu wählen.

Reduzieren Sie Ihren Cloud Waste und Ihre Kosten mit dem effizienten Tool Amazon Auto-Scaling

Lassen Sie sich von unseren zertifizierten AWS-Experten beraten, um Ihre AWS-Ressourcen und Lizenzierungspläne zu optimieren.

Nehmen Sie Kontakt auf

Wie lässt sich Cloud Waste mit AWS Auto Scaling reduzieren?

Was ist AWS Auto Scaling?

Wann braucht Ihr Unternehmen Amazon Auto Scaling?

Komponenten von Amazon Auto Scaling

Skalierungsstrategie: Welche Strategie soll ich wählen?

Roadmap für die Einführung von Amazon Auto-Scaling

Fazit

Reduzieren Sie Ihren Cloud Waste und Ihre Kosten mit dem effizienten Tool Amazon Auto-Scaling

Über den Autor

Oleg Drogayev

Weitere Artikel

AWS Migrationsstrategie: Von vor Ort zu AWS Public Cloud

Aufbau moderner Datenplattformen auf Microsoft Azure – Vorteile und Anwendungsfälle

Ein Handbuch zur Power BI-Migration: 5 Stufen, die zu beachten sind

Wann ist der beste Zeitpunkt, um in die XR-Technologie zu investieren?

AWS im Kern: Ideales Lösungspaket zum Einrichten einer Big Data-Plattform

Das Beste wählen: Vergleichende Analyse zu AWS vs. Azure vs. Google Cloud

Vielen Dank!

Wie lässt sich Cloud Waste mit AWS Auto Scaling reduzieren?

Was ist AWS Auto Scaling?

Robustes AWS Operations Center für ein nordisches Logistikunternehmen

Wann braucht Ihr Unternehmen Amazon Auto Scaling?

Komponenten von Amazon Auto Scaling

Skalierungsstrategie: Welche Strategie soll ich wählen?

Erweiterte Datenverarbeitung auf AWS für mehr als 100.000 Geschäftsanwender

Roadmap für die Einführung von Amazon Auto-Scaling

Fazit

Reduzieren Sie Ihren Cloud Waste und Ihre Kosten mit dem effizienten Tool Amazon Auto-Scaling

Über den Autor

Oleg Drogayev

Weitere Artikel

AWS Migrationsstrategie: Von vor Ort zu AWS Public Cloud

Aufbau moderner Datenplattformen auf Microsoft Azure – Vorteile und Anwendungsfälle

Ein Handbuch zur Power BI-Migration: 5 Stufen, die zu beachten sind

Wann ist der beste Zeitpunkt, um in die XR-Technologie zu investieren?

AWS im Kern: Ideales Lösungspaket zum Einrichten einer Big Data-Plattform

Das Beste wählen: Vergleichende Analyse zu AWS vs. Azure vs. Google Cloud

Subscribe to our updates

Thank you for subscription!

Vielen Dank!