Доклады
AI Hardware In a Nutshell
AI уже стал оказывать значительное влияние на пользовательский опыт владельцев мобильных устройств: AI-агенты помогают распознавать речь, искать информацию, служат голосовым интерфейсом для управления функциями. Разработчики также увеличивают свою эффективность через генерацию кода и документации. Но что дальше? Что будет, если AI будет в центре ОС, а не наложенным агентом? Какого вида будет AI-centered мобильная ОС следующего поколения?
Открытая мобильная платформа
Роман Аляутдин
Большие языковые модели (LLM) захватили мир, но их эффективное внедрение в production упирается в «стеклянный потолок» экосистемы Python. Проблемы с GIL, управлением памятью и сложностью развертывания заставляют искать новые, более системные подходы.
В нашем докладе мы утверждаем, что будущее высокопроизводительной AI-инфраструктуры лежит в системных языках, и Rust — главный кандидат на эту роль. Мы не просто обсудим теорию, а пройдем практический путь проектирования OxideRT — нашего концептуального, легковесного рантайма для AI-моделей на Rust. Мы покажем, как с его помощью можно получить полный контроль над исполнением, безопасно работать с GPU через FFI и заложить архитектуру для будущих компиляторных оптимизаций. Этот доклад для тех, кто хочет заглянуть под капот современных AI-фреймворков и понять, как системное программирование решает их ключевые проблемы.
Raft
Андрей Носов
Мы разберём эволюцию вычислительных архитектур для ИИ — от универсальных CPU к массово-параллельным GPU и специализированным NPU/TPU/ASIC — и объясним, почему именно так сложился ландшафт. Покажем архитектурные причины, по которым CPU и «обычная RAM» упираются в пропускную способность и локальность данных, а GPU выигрывают за счет параллелизма и быстрой HBM/VRAM. Обсудим, почему десятки попыток «сбежать с GPU» на профильные кристаллы упираются в экосистему, стоимость, доступность и зрелость софта — и что должно измениться, чтобы альтернатива стала реальной.
MWS Cloud Platform
Эдгар Сипки
Стремительное развитие HPC, AI/ML-вычислений выдвигает новые требования к дизайну сети ЦОД и используемым там технологиям. Доклад содержит обзор используемых сейчас сетевых технологий для HPC, а также описание новой, специализированной для таких задач, технологии Ultra Ethernet (UE), включая используемые в её спецификации уровни и их функционал.
MWS Cloud Platform
Борис Хасанов
Расскажу о пути перевода обученной нейросети в высокопроизводительный inference-движок для бортового компьютера автономного грузовика.
Эвокарго
Антон Рудоманенко
Доклад освещает текущее состояние и основные тенденции развития современных ускорителей ИИ. Рассматриваются основные архитектуры ускорителей, компании-производители, а также ряд их особенностей.
Сбер
Владимир Горбацевич
Современные модели машинного обучения развиваются по пути увеличения архитектурной сложности. Это повышает интерес к разработке специализированных аппаратных ускорителей (AI-ускорителей) для их эффективного выполнения. Использование всех доступных возможностей AI-ускорителей невозможно без наличия развитого программного инструментария, существенной частью которого является AI-компилятор.

В докладе представлен анализ современных AI-ускорителей, выделены основные архитектурные особенности и принципы их проектирования. Особое внимание уделено практическим аспектам создания инструментария для компиляции и выполнения нейронных сетей на периферийных устройствах. В качестве конкретного примера в докладе будут рассмотрены основные этапы компиляции и выполнения модели PyTorch средствами инфраструктуры ExecuTorch. Заключительная часть доклада будет посвящена перспективам развития AI-компиляторов, включая полиэдральные компиляторы и инфраструктуру MLIR.
ИСП РАН
Иван Кулагин
Я расскажу о том, зачем может быть необходим AI на микроконтроллерах, о сферах применения и некоторых ограничениях при выборе данного подхода. Обсудим, как запустить модель глубокого машинного обучения на микроконтроллере и аппаратных платформах с ограниченными вычислительными ресурсами и малыми объемами оперативной и вторичной памяти. Опишу способы оптимизации нейросетевых моделей и проблемы, которые могут возникнуть в процессе. В докладе будет представлен набор инструментов, с помощью которых можно решить данную задачу. Также расскажу о тех результатах, которые можно получить при запуске модели, о затратах по памяти и времени выполнения.
SberDevices
Павел Шпаковский
В докладе покажем эффективный способ фильтрации сетевого трафика с использованием eBPF, Rust и фреймворка Aya. Рассмотрим, как этот подход обеспечивает высокую производительность, покажем реализацию примера фильтра, обсудим возникающие трудности и поделимся способами их преодоления.
МТС Web Services (MWS)
Дмитрий Богомазов
В докладе расскажем, как мы в Яндексе внедрили QoS в сетях Infiniband при ограниченной вендорской поддержке и скудной практической документации. Обсудим мотивацию: рост смешанных нагрузок во внутреннем облаке и необходимость предсказуемых SLO для различных обучений. Разберем конфигурацию QoS и тестовый сетап GPU кластера Infiniband.
Отдельно рассмотрим, как могут быть связаны QoS и топология сети DragonFly+.
Подведем итоги, как мы сделали приоритизацию трафика различных обучений в кластере, фичей внутреннего облака Яндекса.
Яндекс
Роман Глебов
Обсудим о развитие технологий пространственного AI — одного из важнейших современных направлений в робототехнике и беспилотном транспорте. В докладе рассматриваются концепции пространственного понимания и пространственных рассуждений, возможности современных фундаментальных моделей компьютерного зрения, многомодальных больших языковых моделей (MLLM) для работы с трёхмерными сценами, ограничения текстовых LLM для описания 3D-сцен и современные решения, использующие изображения, текст, облака точек и графы.
AIRI, МФТИ
Дмитрий Юдин
Linux Kernel
В докладе мы рассмотрим:
  • унифицированные интерфейсы доступа к периферии эмулируемого SoC: gpiodev, remote-i2c-master и CDC-ACM Host, их архитектуру и практическое применение;
  • организацию прозрачного взаимодействия с виртуальными устройствами через стандартные инструменты Linux (libgpiod, i2c-tools) и QMP;
  • практические результаты работы с полнофункциональной моделью GD32F30X в QEMU.
YADRO
Никита Шубин
Адаптивный mTHP для Linux Kernel
В настоящее время политики управления большими страницами (THP) применяются глобально для всей системы. Это приводит к фрагментации и увеличению потребляемой памяти. Размер оперативной памяти растет намного быстрее, чем размер кэша трансляций (TLB). Размер TLB ограничен, это будет представлять проблему для приложений с точки зрения производительности. Использование больших страниц — потенциальное решение, так как одна запись в TLB может соответствовать большому участку памяти. Тем не менее и в этом случае фрагментация памяти неизбежна. Сегодня большинство системных администраторов предпочитают выключать большие страницы, считая, что средний уровень производительности лучше чем нестабильный.

Мы расскажем про механизм hybrid page, с помощью которого приложения, для которых важна производительность, могут использовать большие страницы прозрачно, при этом не требуется включение поддержки больших страниц для всей системы.

Мы покажем, как у нас получилось уменьшить потребление больших страниц, и обсудим зависимость уровня потребления больших страниц и производительности приложений.
Независимый эксперт
Михаил Иванов
При запуске ядра Linux на новом устройстве одно дело — убедиться в работоспособности интерфейсов, и совсем другая задача — добиться их требуемой производительности. В случае с высокоскоростным сетевым интерфейсом целый комплекс системных проблем может привести к существенной деградации скорости приема/передачи данных. Какие это проблемы и как они влияют на сетевую производительность в контексте наших чипов, вы узнаете из доклада.
Байкал Электроникс
Сергей Семин
Безопасности много не бывает... Особенно, если речь идет о противодействии Zero-Day-уязвимостям на уровне ядра операционной системы.
Расскажем о нашем опыте применения доверенной среды исполнения на базе Arm TrustZone для контроля целостности ядра Linux, подходах к реализации такой защиты, выборе защищаемых компонентов, поделимся планами на будущее.
Открытая Мобильная Платформа
Дмитрий Алехин
Доклад представляет системный взгляд на эволюцию eBPF от инструмента для трассировки к универсальному фреймворку для кастомизации ядра. Мы выходим за рамки классических применений в сети и безопасности, чтобы исследовать, как eBPF позволяет безопасно и эффективно расширять фундаментальные подсистемы, такие как планировщик CPU и страничный кеш.
Eltex
Александр Лошкарев
Мы строим систему HBF (Host-based Firewall), в которой сетевые политики преобразуются в правила nftables на уровне хоста. При этом любой привилегированный процесс способен их изменить. В докладе рассказывается, как с помощью eBPF и LSM предотвратить несанкционированные изменения правил nftables.
Wildberries & Russ
Вадим Калашников
Lustre — это распределенная файловая система для высокопроизводительных вычислений (HPC), используемая в более чем половине суперкомпьютеров из TOP500.
Доклад посвящен архитектуре Lustre, а также ее наиболее интересным подсистемам и функциям, таким как client-side data compression(CSDC), Hierarchical Storage Management(HSM), lustre quota aggregation(LQA) и multi-tenancy.
Whamcloud
Алексей Журавлев
Whamcloud
Михаил Першин
Независимый эксперт
Сергей Череменцев
В докладе будет рассказано о деятельности Центра исследований безопасности системного программного обеспечения, созданного в ИСП РАН под эгидой ФСТЭК России, а также сделана попытка ответить на сопутствующие вопросы:
  • Зачем более 70 отечественных организаций совместно ведут исследования безопасности свободного программного обеспечения?
  • Как нам удалось подготовить более 600 патчей, принятых в основную ветку ядра за последние три года?
  • Что из себя представляют стабильные ветки ядра Linux, сопровождаемые Центром и почему мы рекомендует использовать их в своей работе?
  • Какие методы тестирования ядра позволяют вылавливать наибольшее число ошибок в ядре на практике?
  • Что можно сделать с лавиной уязвимостей, прилетающих в виде CVE, присвоенных ядру?
ИСП РАН
Алексей Хорошилов
BPF позволяет добавлять новую функциональность в ядро Linux без необходимости перекомпиляции ядра или перезагрузки системы. Программы BPF динамически загружаются в ядро и исполняются. Для ускорения их исполнения в ядре может быть поддержан JIT-компилятор, транслирующий программы BPF напрямую в машинный код соответствующей архитектуры.
Доклад посвящён реализации JIT-компилятора в ядре операционной системы «Эльбрус», основанном на Linux. Будут рассмотрены проблемы создания JIT-компилятора, вызванные тем, что архитектура «Эльбрус» построена по принципу VLIW, и найденное решение, основанное на трансляции набора команд BPF при помощи шаблонов, написанных на ассемблере архитектуры «Эльбрус».
АО «МЦСТ»
Константин Михайлов
Работа WiFi как и любой радиообмен попадает под законы о том, с какой мощностью, на каких частотах и с какими еще нюансами можно работать. В различных государствах эти законы могут отличаться, и нужно каким то образом "научить" WiFi подсистему в Linux учитывать эти региональные ограничения. В докладе будет рассказано, как WiFi подсистема Linux учитывает при работе эти ограничения - как это реализовано в ядре в виде небольшой подсистемы и как устроена userspace часть этой логики.
SberDevices
Арсений Краснов
System Software
Безопасность микроядра некоторыми воспринимается как труизм: микроядро маленькое, драйвера на user space — ну очевидно же, что сокращение поверхности атаки повышает безопасность. Однако кроме этого очевидного утверждения возникает много неочевидных решений, когда уменьшенное количество дает принципиально другое качество.

В докладе обсудим, почему ядерные харденинги лучше работают в микроядре, а не в монолите, как предельно закрутить гайки в передаче информации с user space и почему один heap хорошо, а два — лучше (и почему два heap’а для микроядра хорошо, а для монолита не очень).
System Software
Анна Мелехова
В докладе будут рассмотрены различные механизмы по управлению энергопотреблением: динамический перевод ядер в состояния сниженного энергопотребления (cpuidle); ручное отключение ядер (cpu hotplug); системный сон (system suspend). Также будет представлен имплементированный в ядра компании CloudBEAR вариант аппаратной поддержки данных механизмов, конфигурации Linux Kernel и необходимые компоненты в интерфейсе OpenSBI для включения перечисленных механизмов. Для cpuidle будут представлены результаты тестирования — ориентировочное время, проведенное в состоянии сниженного энергопотребления.
CloudBEAR
Данил Скребенков
В докладе будет представлено:

  • Что такое Zephyr RTOS, история появления, архитектура, доступный функционал, поддерживаемые платформы Синтакор
  • Уровень поддержки архитектуры RISC-V, что поддерживаются в актуальном Zephyr v4.3
  • Доработки Синтакор: AIA, Крипто-расширения, доработки для SMP и операций с кэшами, ограниченная поддержка MMU и S-mode
  • Опыт применения Zephyr: позитивный и не очень
Синтакор
Александр Разинков
В докладе будут рассмотрены изменения в компонентах системного ПО под RISC-V за последний год: состояние ядра Linux, а также поддержка аппаратной виртуализации, как одной из ключевых серверных технологий. Также будут затронуты сопутствующие аспекты, такие как компиляторы, состояние типичных компонент серверного микропрограммного ПО, развитие отраслевых стандартов и состояние поддержки RISC-V в известных дистрибутивах.
Сбер
Андрей Варкентин
В докладе будут описаны некоторые особенности архитектуры RISC-V, как они проявились при переносе серверной операционной системы SberLinux, аспекты, типичные для адаптации ПО и сопутствующей среды сборки под RISC-V, а также примеры синхронизации и переупорядочивания в многопроцессорных системах, невыровненные доступы, различия в системных вызовах, в реализации поддержки плавающей точки, в доступе к таймерам и в карте адресного пространства.
СберТех
Сергей Манюкевич
Диски для виртуальных машин — базовая функциональность для любого облака. Диски бывают разные, тем не менее их подключением хочется управлять единообразно. А еще очень хочется, чтобы подсистема хранения работала эффективно.
В нашем облаке для доставки пользовательского I/O из виртуальной машины до системы хранения мы используем SPDK.
В докладе мы расскажем, что такое SPDK и почему он такой эффективный.

Также мы поделимся нашим опытом эксплуатации SPDK в проде. Разберемся, чего в нем, на наш взгляд, не хватает и как мы реализовывали эту функциональность.
MWS Cloud Platform
Василий Иванов
В мире существует много хранилищ: блочные, объектные, файловые, локальные, распределённые, промежуточные и т. д. Но большинство из них заточены на определенную специфику.

А что, если вынести все основные задачи хранилища на клиента? Шифрование стараются унести на него в первую очередь, но как же сжатие, чексуммы, снашпоты, избыточность? Нужен ли ещё один дополнительный хоп в промежутке?

Поговорим про наши наработки получить универсальный (пока что) блочный сторадж для инфраструктуры github.com/rawstor и о том, что из этого может получиться.
VK Tech
Василий Степанов
Genesis Core
Георгий Меликов
Расскажу о полезных в повседневной работе инструментах экосистемы Nix — от пакетного менеджера и репозитория nixpkgs до home-manager.
На практических примерах покажу, как воспроизводимость окружений помогает отлавливать баги и делает CI/CD надежным. Разберем, как организовать dev-среды для C/C++-проектов и даже виртуальные машины и почему даже bash-скрипту стоит явно указать зависимости.
Сравним Nix с привычными менеджерами пакетов — cargo, npm, poetry, conan — и обсудим, чем философия Nix отличается: почему это не просто инструмент, а другой способ мыслить о сборке и управлении системой.
Сбер
Александр Сергеев
В рамках доклада мы рассмотрим, как создаются средства linux runtime protection y user-space-приложений, какие практические штуки можно использовать на практике без Tetragon и Falco — и как написать свой host base firewall в домашних условиях.
MWS Cloud Platform
Лев Хакимов
В рамках формата лёгкой беседы-монолога хотелось бы не просто рассказать и напомнить о так называемых атаках вида "BadUSB", но и обсудить набор методов по защите от такого рода атак для сред на базе ядра Linux - как встроенных, так и сторонних.
Независимый исследователь
Иван Зорин
Расскажу о том, как использовать векторные инструкции ARM-процессоров в своем коде и какого ускорения можно достичь с помощью них.
SberDevices
Михаил Ивашиненко