Machine Learning Engineer

Budete převádět modely LLM (Large Language Model), TTS (Text to Speech) a ASR (Automatic Speech Recognition) z výzkumu do produkce, tak aby splňovaly požadavky na škálovatelnost, nízké latence a dostupnost. Pokud vás baví Python, Linux, Kubernetes a práce s LLM, TTS a ASR technologiemi, připojte se k nám a využijte stovky GPU karet pro inovativní projekty!  

 Co můžete očekávat 

  • Možnost pracovat s unikátními daty a stovkami GPU karet (H100 a L4) pro inovativní projekty. 
  • Samoorganizovaný tým s přátelskou atmosférou a týmovým duchem. 
  • Prostor pro seberealizaci a profesní růst, včetně sdílení nápadů a inspirace mezi kolegy. 
  • Práci s moderními technologiemi jako vLLM a Triton (TensorRT-LLM, ONNX). 
  • Spolupráci s výzkumníky na implementaci nových LLM, TTS a ASR funkcionalit. 

Co očekáváme od vás

  • Zkušenosti s vývojem v Pythonu nejlépe 2 až 3 roky a alespoň základní zkušenosti s Linuxovým prostředím. 
  • Znalost Kubernetes, Dockeru a cloudových technologií (SCIF). 
  • Zkušenosti s optimalizací inference serverů a monitoringem nasazených modelů. 
  • Znalost technologií jako KServe, S3, MLflow, FastAPI a dalších. 
  • Zájem o LLM, TTS a ASR technologie a ochota se v nich dále vzdělávat. 
  • Schopnost automatizovat a optimalizovat procesy, budovat spolehlivou infrastrukturu.  

Jak probíhá výběrko:  

  1. Po zaslání životopisu se vám ozveme do 3 pracovních dní.
  2. Následně vás čeká praktický úkol – řešení problému, který jsme museli implementovat do naší service (časová náročnost 2–8 hodin).
  3. Poté se setkáte s hiring managerem Markem Šimůnkem na osobním setkání.
  4. Pokud vše ladí, následuje nabídka a vítejte na palubě!