Starszy inżynier ML (fabryka tokenów)

Czechia, Europe, Germany, Israel, Netherlands, UK

Do uzgodnienia

Zdalnie Biuro i administracja

Zarejestruj się, aby aplikować

O tym stanowisku

Numery telefonów i adresy e-mail w tym ogłoszeniu są ukryte do momentu zalogowania.

auto_translated_note

O Nebiusie: Nebius wyznacza nową erę w infrastrukturze chmurowej dla globalnej gospodarki opartej na sztucznej inteligencji. Budujemy kompleksową platformę chmurową AI, która wspiera programistów i przedsiębiorstwa od szkolenia danych i modeli po wdrożenie produkcyjne, bez kosztów i złożoności budowania dużej wewnętrznej infrastruktury AI/ML. Zbudowany przez inżynierów dla inżynierów.

Od orkiestracji procesorów graficznych na dużą skalę po optymalizację wnioskowania - jesteśmy odpowiedzialni za trudne problemy związane z obliczeniami, pamięcią masową, siecią i zastosowaną sztuczną inteligencją. Jesteśmy notowani na giełdzie Nasdaq (NBIS) z siedzibą w Amsterdamie. Mamy globalny zasięg z ośrodkami badawczo-rozwojowymi w Europie, Wielkiej Brytanii, Ameryce Północnej i Izraelu.

Nasz zespół liczący ponad 1500 osób składa się z setek inżynierów posiadających głęboką wiedzę specjalistyczną w zakresie sprzętu, oprogramowania oraz badań i rozwoju sztucznej inteligencji. RoleToken Factory jest częścią Nebius Cloud, jednej z największych chmur GPU na świecie, obsługującej dziesiątki tysięcy procesorów graficznych. Budujemy wysokowydajną platformę do wnioskowania i dostrajania, zaprojektowaną w celu wykorzystania podstawowych modeli do granic możliwości sprzętowych.

Naszą misją jest maksymalizacja przepustowości, minimalizacja opóźnień i optymalizacja kosztu tokena na dziesiątkach tysięcy procesorów graficznych. Oto niektóre kierunki, nad którymi obecnie pracujemy i w których Ty możesz być częścią: Optymalizacja wnioskowania: Identyfikacja wąskich gardeł wnioskowania LLM w celu przyspieszenia produkcji. Wyciskanie maksymalnej wydajności dla szerokiej gamy architektur LLM na dużą skalę (np.

GPT-OSS, Kimi K2.5, DeepSeek V3.1/V3.2, GLM-5). Obsługa silników wnioskowania: wdrażaj nowatorskie architektury dekodowania spekulatywnego, optymalizuj komponenty różnych projektów LLM (gęste/MoE, autoregresyjne/równoległe) i współtwórz silniki wnioskowania typu open source. Szkolenie i wnioskowanie o niskiej precyzji: Projektuj i twórz potoki uczenia i wnioskowania o niskiej precyzji (FP8, NVFP4/MXFP4), co zapewnia mierzalny wzrost przepustowości i efektywności kosztowej.

Oczekujemy, że będziesz mieć: Głębokie zrozumienie teoretycznych podstaw uczenia maszynowego i architektury transformatorów. Doświadczenie w profilowaniu obciążeń GPU za pomocą narzędzia Nsight, PyTorch profiler lub podobnych narzędzi. Zrozumienie hierarchii pamięci GPU i kompromisów w zakresie obliczeń/pamięci.

Znajomość ważnych koncepcji w przestrzeni LLM, takich jak MHA, RoPE, KV-cache, Flash Attention i kwantyzacja. Zrozumienie aspektów wydajnościowych szkoleń w dużych sieciach neuronowych (strategie shardingu, niestandardowe jądra, funkcje sprzętowe itp.). Duże umiejętności w zakresie inżynierii oprogramowania (głównie używamy Pythona).

Głębokie doświadczenie z nowoczesnymi frameworki głębokiego uczenia się Biegłość we współczesnych podejściach do inżynierii oprogramowania, w tym CI/CD, kontrola wersji i testy jednostkowe Silne zdolności komunikacyjne i przywódcze Miło mieć: Doświadczenie w pracy z silnikami wnioskowania typu open source (vLLM, SGLang, TensorRT-LLM), w tym wkład Doświadczenie z językami jądra lub DSL, takimi jak Triton, Cute, CUTLASS, CUDA Doświadczenie w budowaniu i dostarczaniu produktów (niekoniecznie związanych z ML) w dynamicznym środowisku przypominającym start-upy. Silne umiejętności inżynieryjne, w tym doświadczenie w tworzeniu dużych systemów rozproszonych lub usług internetowych o dużym obciążeniu. Projekty typu open source prezentujące Twoje umiejętności inżynieryjne.

Doskonała znajomość języka angielskiego, a także doskonałe umiejętności pisania, artykulacji i komunikacji. Korzyści i korzyści: Konkurencyjne wynagrodzenie Możliwość rozwoju zawodowego i uczenia się Elastyczność i własność Kultura współpracy i innowacyjności Możliwość pracy nad wpływowymi projektami AI Międzynarodowe środowisko i utalentowane zespoły Jak to jest pracować w Nebius: Szybkość ruchu - Odważne myślenie - Stały rozwój - Znaczący wpływ - Zaufanie i prawdziwa własność - Możliwość kształtowania przyszłości AI Oświadczenie o równych szansach: Nebius jest pracodawcą zapewniającym równe szanse. Zależy nam na wspieraniu włączającego i zróżnicowanego miejsca pracy oraz zapewnianiu równych możliwości zatrudnienia we wszystkich aspektach zatrudnienia.

Nie dyskryminujemy ze względu na rasę, kolor skóry, religię, płeć (w tym ciążę), narodowość, pochodzenie, wiek, niepełnosprawność, informacje genetyczne, stan cywilny, status weterana, orientację seksualną, tożsamość lub ekspresję płciową lub jakąkolwiek inną cechę chronioną przez obowiązujące prawo. Kandydaci muszą posiadać zezwolenie na pracę w kraju, w którym składają wniosek, a jako warunek zatrudnienia będą zobowiązani do przedstawienia dowodu potwierdzającego uprawnienia do zatrudnienia. Jeśli potrzebujesz zakwaterowania w trakcie procesu aplikacyjnego, daj nam znać.

Pytania spolecznosci

Ktos tu pracowal? Zapytaj przed aplikacja.

Brak watkow dla tej oferty lub firmy.

Zapytaj spolecznosc Dyskusje o pracy

Zgłoś ogłoszenie

O tym stanowisku

Pytania spolecznosci

Załóż darmowe konto