O tym stanowisku
auto_translated_note
Omówienie Zbuduj warstwę infrastruktury AI, która określa, czy nowoczesne modele faktycznie działają w środowisku produkcyjnym. Większość ról AI znajduje się w warstwie aplikacji. Ten nie.
W DDN zatrudniamy inżyniera AI do pracy nad najtrudniejszą częścią sztucznej inteligencji: systemami, pamięcią masową i infrastrukturą wydajnościową leżącą u podstaw udostępniania i wnioskowania modeli w świecie rzeczywistym. To rola inżynierów, którym zależy na tym, co dzieje się pod obciążeniem, na dużą skalę i podczas produkcji - nie tylko podczas demonstracji. Jeśli Twoje doświadczenie znajduje się na skrzyżowaniu infrastruktury sztucznej inteligencji, systemów rozproszonych i inżynierii wydajności, jest to rodzaj roli, w której Twoja dogłębność będzie miała znaczenie.
Opis stanowiska Co będziesz robić - Budowanie i optymalizacja systemów obsługi i wnioskowania LLM dla środowisk produkcyjnych - Poprawa wydajności na ścieżkach GPU i CPU - Praca nad wąskimi gardłami pamięci podręcznej KV, pamięci, pamięci masowej i przepustowości - Projektowanie i skalowanie systemów obsługujących obciążenia sztucznej inteligencji RAG i wymagające pobierania danych - Wnoszenie wkładu w infrastrukturę, w której architektura pamięci masowej i wydajność systemów w istotny sposób wpływają na wydajność sztucznej inteligencji - Rozwiązywanie problemów inżynieryjnych na skrzyżowaniu sztucznej inteligencji, systemów o wysokiej wydajności i infrastruktury rozproszonej Czego szukamy - Inżyniera, który ma spędził znaczną ilość czasu na budowaniu lub optymalizowaniu produkcyjnych systemów sztucznej inteligencji, a nie tylko na eksperymentowaniu z modelami - Ktoś, kto rozumie, w jaki sposób wydajność wnioskowania jest kształtowana przez interakcję między architekturą obliczeniową, pamięcią, pamięcią masową i obsługą - Głębokie, praktyczne doświadczenie w pracy blisko warstwy systemów - na przykład poprawianie sposobu, w jaki obciążenia przepływają przez zasoby procesora graficznego i procesora, redukując wąskie gardła lub dostrajając infrastrukturę w celu uzyskania lepszej przepustowości i opóźnień - Dowód rzeczywistej własności w obszarach takich jak udostępnianie, pobieranie, buforowanie, przechowywanie lub wydajność rozproszona modeli, a nie tylko praca ze sztuczną inteligencją w warstwie aplikacji - Możliwość wygodnego poruszania się między decyzjami dotyczącymi architektury a praktyczną implementacją, zwłaszcza w środowiskach, w których liczy się wydajność i skala - Wykształcenie sugerujące, że możesz działać w technicznie wymagających środowiskach, niezależnie od tego, czy pochodzi to z infrastruktury AI, systemów o wysokiej wydajności, platform pamięci masowej czy sąsiadujących systemów rozproszonych - Preferowany stopień doktora, ale znacznie mniej ważny niż zbudowanie poważnych systemów w prawdziwym świecie Dlaczego ta rola jest fascynująca - Nie jest to praca „szybkiego inżyniera”. - To nie jest zadanie polegające na opakowaniu AI. - To nie jest ogólna rola backendowa z dodatkiem AI. - To szansa na pracę nad infrastrukturą, od której zależy, czy nowoczesne systemy AI będą szybkie, skalowalne, wydajne i opłacalne komercyjnie. - Jeśli chcesz popracować nad prawdziwą mechaniką wydajności sztucznej inteligencji - udostępnianiem, pobieraniem, wydajnością obliczeniową, zachowaniem pamięci, architekturą pamięci masowej i wnioskowaniem na dużą skalę - właśnie tutaj odbywa się ta praca. Komu spodoba się ta rola - Inżynierowie, którzy lubią głębokie problemy systemowe - Konstruktorzy, którym zależy na wydajności, skali i architekturze - Ludzie, którzy chcą pracować tam, gdzie sztuczna inteligencja spotyka się z infrastrukturą - Kandydaci, którzy woleliby rozwiązywać trudne techniczne wąskie gardła niż dostarczać funkcje sztucznej inteligencji na powierzchni Kto nie powinien aplikować Ta rola nie jest przeznaczona dla: - Czysto akademickich badaczy bez znaczącego udziału w produkcji - Inżynierów oprogramowania ogólnego bez przejrzystych systemów sztucznej inteligencji lub głębi wnioskowania - Kandydatów skupiających się głównie na szybkiej inżynierii lub lekkich integracjach aplikacji - Generalistów MLOps, którzy nie pracowali głęboko nad udostępnianiem, przechowywaniem lub systemy AI o krytycznym znaczeniu dla wydajności Przedział wynagrodzeń: 150 000 - 250 000 dolarów DDN Dlaczego DDN - DDN cieszy się głęboką wiarygodnością w zakresie infrastruktury o wysokiej wydajności, a ta rola przypada na część rynku, gdzie ten fundament ma znaczenie. Jeśli chcesz zbudować systemy, od których zależy poważna sztuczna inteligencja - a nie warstwę, która po prostu na niej znajduje się - masz rzadką okazję, aby zrobić dokładnie to.
Aplikuj, jeśli chcesz zbudować infrastrukturę produkcyjną AI, a nie tylko ją wykorzystać. #Linkedin Aplikuj bezpośrednio na RemoteJobs.org: https://remotejobs.org/remote-jobs/seniorstaff-ai-engineer-ddn