Карьера

Периодически мы ищем людей в команду. Ниже — типы специалистов, с которыми нам интересно работать.


Актуальные вакансии

Inference Engineer

Развёртывание и оптимизация LLM/VLM на GPU-кластерах. PagedAttention, FlashAttention-3, prefix caching, chunked prefill. Disaggregated serving: разделение prefill и decode фаз на разные ноды. Speculative decoding, continuous batching. Квантизация: GPTQ, AWQ, FP8/FP4. Работа с vLLM, SGLang, TensorRT-LLM. Профилирование CUDA-kernels, оптимизация memory bandwidth и KV-cache. Tensor Parallelism, Pipeline Parallelism для multi-GPU. Понимание архитектур трансформеров на уровне attention-механизмов.


Архив

Эти позиции сейчас закрыты, но мы периодически ищем таких специалистов.

Backend / Container Engineer

Проектирование отказоустойчивых stateful-сервисов в Kubernetes. Работа с операторами, CRD, admission webhooks. Настройка сетевых политик, service mesh (Istio/Linkerd), mTLS между сервисами. Опыт отладки проблем с cgroups, namespaces, OOM-killer. Понимание особенностей schedulers для GPU-workloads.

ML Engineer

Построение end-to-end ML-пайплайнов: от feature store до shadow deployment. Работа с drift detection, model versioning, experiment tracking. Опыт интеграции моделей в real-time системы с требованиями к latency p99. Знание trade-offs между batch и online inference. PyTorch, Ray, MLflow, Feature Store (Feast/Tecton).

Data Scientist

Исследовательская работа с графами знаний и векторными представлениями. Построение retrieval-пайплайнов для RAG-систем, оценка качества эмбеддингов (recall@k, MRR). Опыт с графовыми алгоритмами (node2vec, GNN), статистическим анализом A/B-экспериментов. Понимание особенностей работы с мультимодальными данными.

Computer Vision Engineer

Разработка систем детекции и сегментации для production-окружений. Оптимизация моделей под edge-устройства и embedded-платформы. Опыт с камерной калибровкой, геометрическими преобразованиями, SLAM. Работа с датасетами: разметка, аугментации, борьба с domain shift. OpenCV, PyTorch, TensorRT, DeepStream.

Computer Graphics Engineer

Разработка real-time рендеринга и визуализации данных. Работа с графическим пайплайном: vertex/fragment shaders, compute shaders для GPGPU. Опыт с 3D-реконструкцией из point clouds, mesh processing, LOD-системами. Понимание PBR, global illumination, оптимизации draw calls. OpenGL/Vulkan, WebGPU, Three.js.

DevOps / SRE

Построение систем observability: распределённый трейсинг, метрики, логирование. Настройка алертинга с минимизацией false positives, SLO/SLI. Опыт с Prometheus, Grafana, Loki, Tempo/Jaeger. Incident management, постмортемы, capacity planning. Автоматизация инфраструктуры: Terraform, Ansible, GitOps.


Написать нам

Откликнуться

Пишите на career@naasson.com — кратко расскажите, чем занимались и что интересно.