Starszy inżynier wsparcia Cloud i AWS
Australia, Canada, France, Germany, India, Ireland, Netherlands, Spain, United Kingdom, United States
Do uzgodnienia
O tym stanowisku
auto_translated_note
DVT to jedna z wiodących firm zajmujących się tworzeniem oprogramowania na kontynencie, konsultingowa w zakresie najnowocześniejszych aplikacji dla wiodących przedsiębiorstw w Republice Południowej Afryki i na całym świecie. Zależy nam na ciągłym rozwoju naszych pracowników, dzięki silnej kulturze uczenia się, wystąpień wewnętrznych i sponsorowanych wydarzeń technicznych w całym ekosystemie AWS. Poszukujemy starszego inżyniera wsparcia Cloud i AWS, który dołączy do naszego zespołu zajmującego się chmurą w ramach współpracy wbudowanej w klienta.
Jest to podwójna rola: oprócz budowania i utrzymywania infrastruktury chmurowej oraz automatyzacji będziesz zapewniać codzienne wsparcie operacyjne AWS - zarządzanie incydentami, alertami i segregacją żądań, reagowanie na wezwanie oraz stan operacyjny infrastruktury AWS klienta. Pracujesz w zespole operacyjnym klienta („utrzymując światło”), ściśle współpracując z jego platformą i zespołami inżynieryjnymi, aby utrzymać stabilność produkcji i jednocześnie ją ulepszać. Wymagania i odpowiedzialnośćWsparcie i operacjeAWS Działaj jako osoba udzielająca pierwszej pomocy w środowisku AWS klienta - segreguj, diagnozuj i rozwiązuj incydenty oraz zgłoszenia serwisowe w ramach uzgodnionej umowy SLA.
Własna obsługa alertów w CloudWatch, GuardDuty, Security Hub i AWS Health, w tym e-mail/powiadomienia alertowanie rurociągu, wyznaczanie tras i redukcja szumów Uczestnictwo w rotacji dyżurów (w tym obsługa różnych stref czasowych, jeśli wymagają tego uruchomienia klienta) oraz kierowanie ustrukturyzowaną reakcją na incydenty i przeglądami po incydencieZarządzanie kolejką zgłoszeń operacyjnych (incydenty, żądania, problemy i zmiany), utrzymywanie jasnego statusu, własności i komunikacja z interesariuszami klientaTworzenie i utrzymywanie runbooków, playbooków i artykułów z bazy wiedzy w celu standaryzacji reakcji i umożliwienia szybszego, powtarzalnego rozwiązywaniaProwadź zarządzanie problemami - identyfikuj powtarzające się problemy, wykonuj analiza przyczyn źródłowych i przekształcanie wniosków w trwałe poprawki i automatyzację. Obsługa łatania, weryfikacji kopii zapasowych/przywracania i rutynowej konserwacji operacyjnej w ramach zarządzania opartego na tagowaniu i SCP. Infrastruktura i automatyzacja.
Projektuj, wdrażaj i utrzymuj skalowalne potoki CI/CD (np. GitHub Actions, AWS CodePipeline, GitLab CI) do automatycznego testowania, wdrażania i udostępniania. Zarządzaj infrastrukturą jako kodem za pomocą Terraform (podstawowego), CloudFormation i CDK - zdalny stan, refaktoryzacja modułowa i wdrożenia w wielu środowiskachTworzyj efemeryczne środowiska funkcji do izolowanych testów (obszary robocze Terraform / Terragrunt) i automatyzuj dostarczanie, routing (Route 53, ALB/NLB) i likwidację.
Stosuj zaplanowane wyłączenia, aby usprawnić zarządzanie kosztami; użyj tagowania, zmian/tolerancji Kubernetes i harmonogramów łatania opartych na tagachProjektuj i wdrażaj sieci AWS - architektura VPC, grupy zabezpieczeń, NACL, Transit Gateway i łączność hybrydowaWdrażanie i operacjeWspółpracuj z zespołami programistycznymi w celu integracji i wdrażania usług backendu (Java, .NET, Python, Node.js) i aplikacji kontenerowychWdrażaj strategie wdrażania blue/green lub canary dzięki bezpiecznym, identyfikowalnym wdrożeniom i zautomatyzowanym rollbackZintegruj testy jednostkowe i funkcjonalne/API (pytest, Postman/Newman, LocalStack) z potokiem CIUstal konwencje wykonywania testów, znakowania obrazów, wersjonowania i komponentów CI/CD wielokrotnego użytkuZarządzaj wdrożeniami produkcyjnymi, zmieniaj okna i koordynuj wydawanie wydań w całym środowiskuMonitorowanie, bezpieczeństwo i zgodnośćWdrażaj kompleksowe monitorowanie, rejestrowanie i obserwowalność (CloudWatch, X-Ray, APM innej firmy)Monitoruj i optymalizuj wydajność systemu, efektywność wdrażania, wykorzystanie zasobów i koszty chmury Utrzymanie najlepszych praktyk w zakresie bezpieczeństwa - dobrze zaprojektowane i OWASP, zarządzanie sekretami (Secrets Manager, magazyn parametrów), zasady IAM, skanowanie SAST/DAST i kontrola zgodności Konfigurowanie alertów i przepływów pracy w odpowiedzi na incydenty oraz prowadzenie przeglądów po incydencie Zapewnienie zgodności z odpowiednimi normami (ISO 27001, SOC 2, POPIA / RODO) zgodnie z wymaganiami klienta Kierownictwo i klient ZaangażowanieZapewnianie przywództwa technicznego i mentoringu młodszym inżynierom i zespołom rozwoju klientaNawiązuj bezpośrednią współpracę z interesariuszami klienta, aby zrozumieć wymagania, doradzać i prezentować rozwiązaniaUczestniczyć w przeglądach architektury, retrospektywach i planowaniu ciągłego doskonalenia narzędzi i procesówPrzeprowadzać szkolenia i tworzyć dokumentację w celu osadzenia DevOps i najlepszych praktyk operacyjnychWnosić wkład w przedsprzedaż - projektowanie rozwiązań, szacowanie nakładu pracy i propozycje techniczneWymagane doświadczenie i umiejętnościCo najmniej 7 lat w Cloud DevOps, SRE lub Wsparcie operacyjne AWS z dużym doświadczeniem w zakresie CI/CD i automatyzacji infrastrukturyPraktyczne doświadczenie w prowadzeniu wsparcia/operacji zarządzanych przez AWS - zarządzanie incydentami, segregacja alertów, rozwiązywanie problemów na wezwanie i rozwiązania związane z umową SLAGłęboka biegłość w AWS: EC2, ECS/EKS, Lambda, S3, DynamoDB, RDS, VPC, Route 53, CloudFront, IAM (Identity Center), CloudWatch, X-RayExpert IaC (Terraform wymagane; korzystne CloudFormation) - stan zdalny, moduły, wielośrodowisko Solidna platforma CI/CD (GitHub Actions, CodePipeline, GitLab CI lub Jenkins) Zaawansowane skrypty w Bash lub Python do automatyzacji i narzędzi Konteneryzacja i orkiestracja (korzystne Docker, Kubernetes/EKS, Helm) Znajomość AWS GuardDuty, Security Hub i AWS Health obsługa i segregacja alertówDoświadczenie z przepływami pracy ITSM / zgłoszeń oraz ustrukturyzowanym zarządzaniem incydentami, problemami i zmianamiNarzędzia do monitorowania/obserwacji (CloudWatch, Prometheus, Grafana, Datadog lub podobne) Sieć AWS - projektowanie VPC, grupy bezpieczeństwa, moduły równoważenia obciążenia, DNS, łączność hybrydowa Zarządzanie sekretami (Secrets Manager, Parameter Store, HashiCorp Vault) Praktyki DevSecOps - SCA/SAST/DAST, automatyzacja podatności i zgodnościAWS optymalizacja kosztów, strategie tagowania i praktyki FinOps Doskonała komunikacja; sprawdzony mentoring; doradztwo / świadczenie usług profesjonalnych wśród równoczesnych kontaktów z klientamiPreferowane kwalifikacjeCertyfikaty AWS - Solutions Architect Professional, DevOps Engineer Professional, specjalnośćAWS Certified SysOps Administrator (skoncentrowany na operacjach)Certyfikowany administrator Kubernetes (CKA) / Application Developer (CKAD)Doświadczenie w architekturze chmur wielochmurowych (AWS, Azure, GCP) lub hybrydowychDoświadczenie w branżach regulowanych (usługi finansowe, gry/loteria, opieka zdrowotna, rząd)Narzędzia GitOps (ArgoCD, Flux); projektowanie bezserwerowe i oparte na zdarzeniach Odzyskiwanie po awarii, strategie tworzenia kopii zapasowych i wdrożenia w wielu regionachZarządzanie konfiguracją (Ansible, Chef, Puppet); wystąpienia publiczne / wkłady typu open sourceMinimalne wymagania Certyfikat maturalny (klasa 12) Licencjat z informatyki, IT, inżynierii lub dziedziny pokrewnej (lub równoważne doświadczenie praktyczne) Co najmniej jeden odpowiedni certyfikat zawodowy (inżynier AWS DevOps, architekt rozwiązań, administrator SysOps, CKA lub równoważny) Zezwolenie na pracę w Republice Południowej Afryki lub ważne zezwolenie na pracę Gotowość do udziału w rotacji na wezwanie w celu wsparcia produkcyjnego AWS Możliwość okazjonalnych wyjazdów na spotkania z klientami lub wizyty w witrynieKim jesteśmy:WyróżnieniaDołącz jako starszy inżynier wsparcia Cloud i AWS, aby zarządzać operacjami AWS, kierować reagowaniem na incydenty, budować infrastrukturę za pomocą Terraform i CI/CD oraz zwiększać niezawodność.Oryginalnie opublikowano w Himalayas