Möchten Sie mit Ihrem Team teilnehmen? Ab drei Personen profitieren Sie von unseren Gruppenrabatten! Direkt im Shop buchen!

SRE-Prinzipien für zuverlässige Produkte

Site Reliability Engineering (SRE) hat sich in den vergangenen Jahren als Ansatz für den verlässlichen Betrieb verteilter Systeme etabliert.

Im Verlauf des Workshops werden die Teilnehmer SRE-Prinzipien und die SRE-Pyramide kennen lernen und im Wechsel von Theorie und interaktiven Elementen die Bereiche Monitoring und Observability, Incident Response sowie Post Mortems und Root-Cause-Analysen vertiefen.

Am Ende sollen die Teilnehmer ein Tool-agnostisches Verständnis von SRE mitnehmen, das sie auch in ihrem eigenen Arbeitsalltag einsetzen können.

Vorkenntnisse

Teilnehmer sollten ein Grundverständnis für Architektur und Betrieb moderner und verteilter Applikationen mitbringen.

Lernziele

Bei den Teilnehmern soll das Interesse für SRE geweckt werden. Die SRE-Konzepte sollen anhand von Best Practices sowie Gruppendiskussionen und -arbeiten in einer Weise vermittelt werden, dass sie auch im eigenen Kontext einsetzbar sind.

Agenda

  • 9:00 - 10:00 Uhr: Ankunft und Begrüßungskaffee
  • 10:00 - 11:00 Uhr: Einführung
    • Vorstellung
    • Die Geschichte von SRE und die SR- Prinzipien
    • SRE im aktuellen Kontext (DevOps, Platform Engineering, DevEx)
  • 11:00 - 12:30 Uhr: Grundlagen der SRE Pyramide
    • Monitoring
    • Incident Response
    • Post Mortems und Root Cause Analysis
  • 12:30 - 13:30 Uhr: Mittagspause
  • 13:30 - 15:00 Uhr: Hands-On Block
    • Exploratives Debugging der Demo-Anwendung
    • Identifizieren von Problemen und Tool-Lücken
    • Evaluieren von Lösungen und gemeinsame Verbesserungen
  • 15:00 - 15:15 Uhr: Kaffeepause
  • 15:15 - 17:00 Uhr: Hands-On Block und/oder Open Space
    • Chaos Engineering und Incident Response
    • Optional: Open Space zum gemeinsamen Diskutieren von Fragen/Themen der Teilnehmer
  • ca. 17:00 Uhr: Ende des Workshops

Pausenzeiten

  • ab 09:00 Uhr: Registrierung und Begrüßungskaffee
  • 10:00 Uhr: Beginn
  • 12:30 - 13:30 Uhr: Mittagspause
  • 15:00 - 15:15 Uhr: Kaffeepause
  • 16:15 - 16:30 Uhr: Kaffeepause
  • ca. 17:00 Uhr: Ende

 

Technische Anforderungen

  • Eigener Laptop mit aktuellem Browser
  • Kostenloser Miro-Account
  • Optional: lokale kubectl Installation für die Interaktion mit dem Demo-Cluster und der Demo-Anwendung

Speaker

 

Bastian Spanneberg
Bastian Spanneberg ist seit vielen Jahren in den Bereichen Site Reliability Engineering und DevOps tätig. Er arbeitete unter anderem bei Unternehmen wie Instana und Clickhouse und ist aktuell Teil des SRE-Teams bei Celonis.

Marcel Birkner
Marcel Birkner ist Founding Engineer beim Observability-Startup Dash0. Er kann auf langjährige Erfahrung im Bereich Site Reliability zurückblicken, die er sich bei Unternehmen wie Instana und Clickhouse erworben hat.

CLC-Newsletter

Sie möchten über die Continuous Lifecycle und die ContainerConf auf dem Laufenden gehalten werden?

 

Anmelden