Starszy inżynier ML (fabryka tokenów)
Czechia, Germany, Israel, Netherlands, United Kingdom
Do uzgodnienia
O tym stanowisku
Numery telefonów i adresy e-mail w tym ogłoszeniu są ukryte do momentu zalogowania.
auto_translated_note
O Nebiusie: Nebius wyznacza nową erę w infrastrukturze chmurowej dla globalnej gospodarki opartej na sztucznej inteligencji. Budujemy kompleksową platformę chmurową AI, która wspiera programistów i przedsiębiorstwa od szkolenia w zakresie danych i modeli po wdrożenie produkcyjne, bez kosztów i złożoności budowania dużej wewnętrznej infrastruktury AI/ML. Zbudowany przez inżynierów dla inżynierów.
Od orkiestracji procesorów graficznych na dużą skalę po optymalizację wnioskowania - jesteśmy odpowiedzialni za trudne problemy w zakresie obliczeń, pamięci masowej, sieci i stosowanej sztucznej inteligencji. Jesteśmy notowani na giełdzie Nasdaq (NBIS) i z siedzibą w Amsterdamie. Mamy globalny zasięg z ośrodkami badawczo-rozwojowymi w Europie, Wielkiej Brytanii, Ameryce Północnej i Izraelu.
Nasz zespół liczący ponad 1500 osób składa się z setek inżynierów posiadających głęboką wiedzę specjalistyczną w zakresie sprzętu, oprogramowania oraz badań i rozwoju sztucznej inteligencji. RoleToken Factory jest częścią Nebius Cloud, jednej z największych chmur GPU na świecie, obsługującej dziesiątki tysięcy procesorów graficznych. Budujemy wysokowydajną platformę do wnioskowania i dostrajania, zaprojektowaną w celu wykorzystania podstawowych modeli do granic możliwości sprzętowych.
Naszą misją jest maksymalizacja przepustowości, minimalizowanie opóźnień i optymalizacja kosztu tokena na dziesiątkach tysięcy procesorów graficznych. Niektóre kierunki, nad którymi obecnie pracujemy i których możesz być częścią: Optymalizacja wnioskowania: identyfikacja wąskich gardeł wnioskowania LLM w celu przyspieszenia produkcji. Wyciskanie maksymalnej wydajności dla szerokiej gamy architektur LLM na dużą skalę (np.
GPT-OSS, Kimi K2.5, DeepSeek V3.1/V3.2, GLM-5). Obsługa silników wnioskowania: wdrażanie nowatorskich architektur dekodowania spekulatywnego, optymalizacja komponentów różnych projektów LLM (gęste/MoE, autoregresja/równoległość) i wnoszenie wkładu w silniki wnioskowania typu open source. Szkolenie i wnioskowanie o niskiej precyzji: projektowanie i produkcja niskoprecyzyjne (FP8, NVFP4/MXFP4) potoki szkoleniowe i wnioskowania zapewniające wymierny wzrost przepustowości i efektywności kosztowej.
Oczekujemy, że będziesz mieć: Dogłębne zrozumienie teoretycznych podstaw uczenia maszynowego i architektury transformatorów. Doświadczenie w profilowaniu obciążeń GPU za pomocą Nsight, PyTorch profiler lub podobnych narzędzi. Zrozumienie hierarchii pamięci GPU i kompromisów w zakresie obliczeń/pamięci.
Znajomość ważnych koncepcji w przestrzeni LLM, takich jak takie jak MHA, RoPE, KV-cache, Flash Attention i kwantyzacja. Zrozumienie aspektów wydajnościowych szkoleń w dużych sieciach neuronowych (strategie shardingu, niestandardowe jądra, funkcje sprzętowe itp.). Duże umiejętności inżynierii oprogramowania (głównie używamy Pythona).
Głębokie doświadczenie z nowoczesnymi frameworkami głębokiego uczenia. Biegłość we współczesnych podejściach do inżynierii oprogramowania, w tym CI/CD, kontrola wersji i testowanie jednostkowe. Silne zdolności komunikacyjne i przywódcze.
Warto mieć: Doświadczenie w pracy z silnikami wnioskowania typu open source (vLLM, SGLang, TensorRT-LLM), w tym wkładDoświadczenie z językami jądra lub DSL, takimi jak Triton, Cute, CUTLASS, CUDAA, udokumentowane doświadczenie w budowaniu i dostarczaniu produktów (niekoniecznie związanych z ML) w dynamicznym środowisku przypominającym start-upy. Silne umiejętności inżynieryjne, w tym doświadczenie w tworzeniu dużych systemów rozproszonych lub usług internetowych o dużym obciążeniu. Projekty typu open source prezentujące Twoje umiejętności inżynieryjne.
Doskonała znajomość języka angielskiego, a także doskonałe umiejętności pisania, artykulacji i komunikacji. Korzyści i Korzyści: Konkurencyjne wynagrodzenie Możliwość rozwoju zawodowego i uczenia się Elastyczność i własność Kultura współpracy i innowacyjności Możliwość pracy nad wpływowymi projektami AI Międzynarodowe środowisko i utalentowane zespoły Jak to jest pracować w Nebius: Szybkość działania - Odważne myślenie - Stały rozwój - Znaczący wpływ - Zaufanie i prawdziwa własność - Możliwość kształtowania przyszłości AI Oświadczenie o równych szansach: Nebius jest pracodawcą zapewniającym równe szanse. Zależy nam na wspieraniu włączającego i zróżnicowanego miejsca pracy oraz zapewnianiu równych możliwości zatrudnienia we wszystkich aspektach zatrudnienia.
Nie dyskryminujemy ze względu na rasę, kolor skóry, religię, płeć (w tym ciążę), pochodzenie narodowe, pochodzenie, wiek, niepełnosprawność, informacje genetyczne, stan cywilny, status weterana, orientację seksualną, tożsamość lub ekspresję płciową lub jakąkolwiek inną cechę chronioną przez obowiązujące prawo. Kandydaci muszą mieć zezwolenie na pracę w kraju, w którym składają wniosek, i będą zobowiązani do przedstawienia dokumentu potwierdzającego uprawnienia do zatrudnienia jako warunku zatrudnienia. Jeśli potrzebujesz zakwaterowania w trakcie procesu aplikacyjnego, daj nam znać.
Oryginalnie opublikowano w Himalajach