Aleksandr I. Panov
Директор лаборатории когнитивных ИИ систем в AIRI
Руководитель Центра когнитивного моделирования МФТИ
Александр Панов
Москва, Россия
В настоящее время я руковожу лабраторией когнитивных систем искусственного интеллекта в Институте искусственного интеллекта AIRI, занимаюсь глубоким обучением с подкреплением и воплощенным искусственным интеллектом в Центре когнитивного моделирования Московского физико-технического института (МФТИ). Мои научные интересы в настоящее время связаны с трансформерными и структурированным моделям мира в обучениия с подкреплением, применением языковых моделей для планирования поведения (в том числе для робототехнических платформ), мультиагентным планированием и обучением, визуальной навигацией внутри помещений. В AIRI я занимаюсь в первую очередь фундаментальными исследования по созданию новых нейросимвольных архитектур для планирования и обучения, разработкой новых архитектур LLM/VLA-агентов. В МФТИ веду прикладную деятельность и руковожу заказными научно-исследовательскими работами в области обучения с подкреплением, робототехники и систем управления. C 2019 являюсь научным руководителем прикладных исследований в области разработки систем компьютерного зрения и планирования для мобильной робототехники и беспилотного транспорта по заказу таких компаний как НКБ ВС, Интегрант, Хуавей, Сбер. Также в МФТИ являюсь руководителем магистерской программы по искусственному интеллекту, которая являются одной из самых востребованных академических программ в ФПМИ.
Краткая биография: В 2005 году закончил физико-математическую школу при Новосибирском государственном университете (НГУ) и затем учился в бакавриате физического факультета НГУ со специализацией в автоматизации физико-технических исследований. Магистратуру по прикладной математике и физике закончил в МФТИ, кафедра Интеллектуальных систем (базовая кафедра Вычислительного центра РАН). Кандидатскую диссертацию выполнил в Институте системного анализа (ИСА РАН) под руководством Г.С. Осипова (тема «Исследование методов, разработка моделей и алгоритмов формирования элементов знаковой картины мира субъекта деятельности»). С 2011 по 2024 год работал в ИСА РАН (позднее воешедшем в состав Федерального исследовательского центра «Информатика и управление» РАН, ФИЦ ИУ РАН), в отделе «Интеллектуальные динамические системы и когнитивные исследлвания» и занимался развитием различных подходов в области обучения с подкреплением. С 2019 года руковожу Научно-образовательным центром когнитивного моделирования МФТИ и магистерской программой «Методы и технологии искусственного интеллекта» ФПМИ. В августе 2021 году присоединился к команде AIRI. В ноябре 2024 года защитил диссертацию на соискание учёной степени доктора физико-математических наук по специальности 1.2.1 “Искусственный интеллект и машинное обучение” (тема “Методы и алгоритмы нейросимвольного обучения и планирования поведения когнитивных агентов”).
Награды: В 2017 году стал лауреатом медали Российской академии наук для молодых ученых. В 2019 году был руководителем команды CDS, выигравшей первое место в соревновании NeurIPS MineRL. В 2023 году был руководителем команды SkillFusion, занявшей первое место в соревновании CVPR Habitat. Являюсь руководителем успешно завершенных грантов РФФИ и РНФ. Лауреат премии Yandex ML Prize 2024 в номинации Научные руководители. Научный консультант команды Авторобтикс, ставшей победителем технологического конкурса Up Great “5 уровень” 2024 года по беспилотным грузовым перевозкам.
Академическая работа: С 2019 года являюсь редактором журнала Cognitive Systems Research (Elsevier). С 2015 состою в Российской ассоциации искусственного интеллекта (РАИИ), до 2022 год входил в Научный совет. С 2017 года провожу ежегодные летние школы РАИИ и AIRI. В 2021 и 2022 был организатором соревнования NeurIPS IGLU. Вхожу в программный комитет конференций AAAI 2023, 2024, 2025, ECAI 2023, 2024, IROS 2023, 2024, ICRA 2024, CVPR 2024, 2025, NeurIPS 2024, IJCAI 2024, ICLR 2025, ICAPS 2025, AISTATS 2025, ICML 2025 и в циклах рецензирования ACL.
новости
Jan 29, 2025 | The paper “Relational Object-Centric Actor-Critic” has been accepted for presentation at CLeaR 2025. |
---|---|
Jan 25, 2025 | Two papers “POGEMA: A Benchmark Platform for Cooperative Multi-Agent Navigation” and “Learning Successor Features with Distributed Hebbian Temporal Memory” have been accepted for presentation at ICLR 2025. |
Jan 20, 2025 | The paper “Rethinking Exploration and Experience Exploitation in Value-Based Multi-Agent Reinforcement Learning” has been published at IEEE Access. |
Dec 10, 2024 | The paper “MAPF-GPT: Imitation Learning for Multi-Agent Pathfinding at Scale” has been accepted for presentation at AAAI 2025. |
Dec 1, 2024 | The paper “Applying Opponent and Environment Modelling in Decentralised Multi-Agent Reinforcement Learning” has been published at Cognitive Systems Research. |