«Роскосмос»: «Цифровая Земля» — объективные данные о земле и ресурсах
Андрей Абросимов и Алексей Беленов: «Наша задача — разработать простые и удобные инструменты, которые позволят даже малоподготовленному пользователю извлекать из космических снимков полезную и наглядную информацию».
Андрей Абросимов, заместитель генерального директора «ТЕРРА ТЕХ» по науке, и Алексей Беленов, заместитель генерального директора «ТЕРРА ТЕХ» по производству, — о проекте «Цифровая Земля», ставшем фабрикой для обработки и анализа космических снимков с использованием искусственного интеллекта.
Спутниковые снимки Земли являются ценнейшим источником информации. Применять ее для всеобщей пользы призван комплекс «Цифровая Земля — сервисы», реализуемый по заказу госкорпорации «Роскосмос» компанией «ТЕРРА ТЕХ» (оператор по геотехнологиям «Роскосмоса», дочернее предприятие АО «Российские космические системы»). «Цифровая Земля» — это фабрика для обработки и анализа космических снимков с использованием искусственного интеллекта. Благодаря ее возможностям, контролирующие органы и бизнес на всех уровнях теперь могут получать аналитику на основе космической съемки в разы быстрее и удобнее, чем когда-либо до этого. Использование нейросетевых технологий дает существенное преимущество в плане быстроты и качества распознавания снимков, позволяет идентифицировать и классифицировать различные объекты и изменения на местности, вовремя уведомлять пользователей о критичных событиях на объектах мониторинга.
О реализации проекта рассказывают номинанты премии Data Award Андрей Абросимов, заместитель генерального директора «ТЕРРА ТЕХ» по науке, и Алексей Беленов, заместитель генерального директора «ТЕРРА ТЕХ» по производству.
- Немного об истории этого проекта. Когда и почему он был начат?
Алексей Беленов: Нужно начать с нескольких фундаментальных задач, которые госкорпорация «Роскосмос» взялась решить по поручению президента России, инициировав проект «Цифровая Земля» в рамках национальной программы «Цифровая экономика». Первая группа задач связана с модернизацией технологий. Было очевидно, что настало время качественно улучшить механизм поставки данных с российских аппаратов дистанционного зондирования Земли (ДЗЗ) из космоса и повысить качество их обработки. Эту часть взяли на себя наши коллеги из АО «Российские космические системы» (входит в Госкорпорацию «Роскосмос»): они создали и внедрили на базе современного комплекса вычислительных ресурсов технологию автоматической потоковой обработки спутниковых данных, благодаря которой высококачественная информация со спутников в максимально сжатые сроки может пополнять информационные системы заказчиков и потребителей данных ДЗЗ. Мы работаем с коллегами в тесном контакте, но сами фокусируемся на высокоуровневой обработке, анализе и применении космических данных.
Андрей Абросимов: Наша задача — разрабатывать и использовать технологии, направленные на отраслевое применение материалов космической съемки. У многих потребителей нет достаточной подготовки и квалификации, чтобы самостоятельно интерпретировать снимки со спутника. Поэтому родилась идея создать комплекс сервисов, способный обрабатывать и анализировать снимки и сразу формировать цифровые тематические карты, отчеты и инфографику.
- Какие задачи требовалось решить?
А.А.: Дальше мы будем говорить только о сервисах «Цифровой Земли», но хотелось бы обратить внимание на то, что вся эта работа была бы практически невозможна без технологий потоковой обработки снимков. А если говорить о сервисах, то у нас было довольно ясное видение того, какие задачи можно решать, используя снимки, и что для этого нужно. В России многие компании делают разного рода ГИС-порталы и создают средства обработки как на региональном, так и на федеральном уровне. Но для нас было важно сформировать универсальный набор продуктов, способный по максимуму закрыть потребности государственных организаций в масштабах всей страны, коммерческих заказчиков, а в будущем — и наших граждан.
- Какие этапы проходил проект? Что было самым сложным?
А.Б.: Мы начали с анализа потребностей потребителей по продуктам и составу информации. Уже до эскизного проектирования стало очевидно, что делать такие продукты классическими методами в больших объемах будет непросто. Встал вопрос автоматизации такой работы. Мы начали экспериментировать с алгоритмами искусственного интеллекта (ИИ), поскольку другие подходы не обеспечивали ни достаточной скорости, ни качества обработки. Потребовалось включить в команду специалистов в области data science, ИИ, облачных вычислений и нарастить соответствующие компетенции, чтобы результаты работы алгоритмов соответствовали заданным техническим заданием требованиям.
А.А.: Это верно. Я, например, первоначально не был доволен качеством результатов обработки, но, по мере увеличения обучающих выборок для различных регионов РФ, качество начало резко повышаться. Мы разработали 27 типовых продуктов по 7 основным направлениям народного хозяйства (деятельность в этих отраслях можно отслеживать из космоса). Есть отдельные продукты, формирование которых все же требует экспертного анализа, доработки оператором результатов первичной автоматической аналитики, однако многие продукты уже сейчас формируются без экспертного анализа.
- Что на данный момент представляет собой платформа? Из каких частей она состоит?
А.Б.: В комплекс «Цифровая Земля — сервисы» входят 7 геосервисов с 27 информационными базовыми и мониторинговыми продуктами. Сервисы интегрированы с другими подсистемами создаваемой «Цифровой Земли» и опираются на них в части вычислительных ресурсов и исходных данных, которые поступают напрямую из Федерального фонда данных ДЗЗ и других источников. Структура комплекса сервисов включает: подсистему ввода информации; подсистему обработки информации, включающую модуль искусственного интеллекта (ИИ); подсистему представления информации, включающую модули личных кабинетов, формирования отчетов, десктопный и мобильный интерфейсы. Разработан API (программный интерфейс приложения), позволяющий передавать результаты анализа непосредственно в сторонние информационные системы.
А.А.: Авторизация происходит по единой учетной записи доступа к ресурсам «Роскосмоса». Существует несколько групп пользователей с разными правами. Пользователь размещает заказ на определенный тип продукта, уточняет параметры подбора: область на карте, по которой нужно получить аналитическую информацию; период дат, которые интересуют; уровень детализации и т. д. Затем заявка попадает в электронную очередь, где проверяется на корректность. Если что-то не так, мы связываемся с потребителем для уточнения. Далее происходит подбор космической съемки, удовлетворяющей заданным критериям, и после этого производится ее автоматическая обработка в модуле ИИ. Пользователь получает уведомления по мере прохождения этапов обработки и анализа. Все результаты доступны для просмотра и скачивания в интерфейсе пользователя.
- На каких платформах реализована система?
А.Б.: В основе лежат облачные технологии. Для хранения, обработки, визуализации, управления данными используются протоколы AWS, докер-контейнеры, средства PostgresSQL, REST API, MongoDB, WMS, Flask, Nginx, uWSGI. Для работы с нейросетевыми технологиями применяются фреймоворки сверточных нейронных сетей Tensorflow, Keras, Pytorch.
- В чьих интересах система работает? Как осуществляется взаимодействие между заинтересованными сторонами?
А.Б.: «Цифровая Земля» — это сложный проект с множеством составных частей, не все из которых пока готовы. Одна из составных частей — комплекс геосервисов — сейчас работает для пилотных регионов и ряда федеральных органов власти. У нас очень активное сотрудничество с федеральными органами, поскольку мы проводим взаимную интеграцию информационных систем. Например, с НИИ «Восход» мы интегрировались для выявления объектов капитального строительства, требующих проверки в части постановки на кадастровый учет. Их система ТОР КНД получает из «Цифровой Земли» информацию о вновь выявленных на снимках объектах капитального строительства в муниципальном образовании и выдает сигнал надзорным органам, если информация в реестре и на снимке разная.
А.А.: Кроме того, мы плодотворно сотрудничаем с ФГБУ «Рослесинфорг», подведомственным учреждением Рослесхоза. Они проводят квалифицированную оценку результатов выделения вырубок на снимках и формируют требования по модернизации алгоритмов искусственного интеллекта. Совместными усилиями нам удалось повысить точность выделения лесоизменений более чем на 10% даже при использовании разносезонных снимков и данных с облачностью и снегом. Перспективной выглядит возможность предоставлять организациям Рослесхоза интерактивные инструменты для дальнейшего дообучения алгоритмов нейросетей на большом массиве лесных данных. В рамках промышленной эксплуатации геосервисов «Цифровой Земли» запланированы работы по массовой выдаче типовых тематических продуктов. В ходе этого процесса мы будем собирать обратную связь и планировать дальнейшую модернизацию системы. Сейчас «Роскосмос» рассматривает расширение охвата субъектов РФ.
- Как проходила отработка сервисов? Исходя из чего выбирались тестовые регионы и сервисы?
А.А.: В числе пилотных регионов у нас было 8 субъектов. Отработка сервисов проводилась в Республике Татарстан, в Самарской, Нижегородской, Тверской, Кемеровской и Свердловской областях, в Республике Крым и Красноярском крае. Суммарно в ходе пилотной эксплуатации комплекса «Цифровая Земля» представители профильных министерств и ведомств субъектов РФ отработали 1552 кейса по объектам интереса общей площадью более 3 млн кв. км. На территории всех этих субъектов были выполнены масштабные полевые работы для сбора информации о наземных эталонах распознаваемых объектов и проверки результатов автоматической аналитики. Поскольку в продуктах применяются технологии ИИ, очень важно правильно подбирать обучающие выборки. У нас очень большая страна с различными климатическими поясами, разнообразными природными ресурсами и большим количеством территориальных активов, поэтому мы очень хотели, чтобы эти субъекты были максимально разнообразными. Понятно, что 8 эталонных субъектов — это пока маловато для репрезентативной обработки всей территории РФ, но прелесть технологии как раз в том, что чем больше ее применяешь, тем лучше становятся результаты, потому что нейросети дообучаются по мере увеличения объемов «скормленных» им космических снимков.
- Приведите самые интересные и показательные примеры использования геосервисов.
А.А.: Сегодня очень большое внимание уделяется лесу и экологии. Буквально на днях (11 февраля 2022 года) «ТЕРРА ТЕХ» посетили вице-премьеры Правительства РФ Виктория Абрамченко и Юрий Борисов вместе с генеральным директором «Роскосмоса» Дмитрием Рогозиным. По итогам рабочего совещания было принято решение провести в 2022 году силами Рослесхоза и «Роскосмоса» пилотный проект в двух субъектах — Иркутской и Архангельской областях — по применению геотехнологий в целях повышения скорости получения и точности информации о вырубке лесов на основе анализа материалов космической съемки с использованием нейросетей. Также мы провели много работ по выявлению и мониторингу карьеров добычи общераспространенных полезных ископаемых, мониторингу промышленного и жилого строительства, определению степени зарастания сельскохозяйственных земель. У «Цифровой Земли» здесь чисто информационная и аналитическая функция. Наша задача — выполнить идентификацию, подготовить отчет и предоставить информацию соответствующим надзорным органам, а дальше именно они решают, было или нет нарушение, и проводят необходимые контрольные мероприятия. Фактически шок-эффект произвел кейс с пожарами в Якутии и Иркутской области прошлым летом, когда нейросети за несколько часов с очень высокой точностью обработали миллионы квадратных километров территории, затронутой бедствием.
- Какое направление геосервисов приносит наибольшую пользу уже сейчас?
А.А.: В последнее время мы обращали особое внимание на вырубки — здесь наиболее очевидная польза. О результатах пока говорить преждевременно, но мы готовы предоставить Рослесхозу имеющиеся у нас технологии и решения для цифровизации лесного хозяйства страны. Тут важно повышать частоту выявления рубок, а это зависит от доступности данных, количества спутников и их характеристик. Но даже с теми данными, что имеются сейчас, можно многого добиться. Космические инструменты нужны и коммерческим предприятиям, которые ведут лесозаготовку и инвестируют в лесопромышленный комплекс страны. Например, по данным из космоса можно выявлять наиболее перспективные лесные участки на основе знаний о породном и возрастном составе. Большим спросом пользуется контроль соблюдения темпов строительства — особенно для масштабных проектов строительства линейной инфраструктуры, а также когда у заказчика одновременно строится множество объектов в разных концах страны и нужно отслеживать их все одновременно.
- Нацелен ли проект на окупаемость? И вообще, насколько эти сервисы могут быть востребованы бизнесом?
А.Б.: Прямой эффект от внедрения технологий ДЗЗ оценить непросто. Это уже много лет пытаются делать ведущие консалтинговые агентства мира. Можно посчитать хотя бы число нарушений и объем штрафов, которые будут выставлены на основе космической аналитики. Данные ДЗЗ применяются, когда рассчитывается объем причиненного экономического и экологического ущерба (например, почвам). В этих случаях всего нескольких крупных экологических взысканий хватит, чтобы окупить разработку. Конечно, помимо этого, есть еще вся инфраструктура, ее содержание, спутники и т. д. В то же время нельзя забывать о том, что один снимок можно использовать сразу для целого комплекса задач и не один раз — например, у нас 27 продуктов (не все делаются по одинаковым данным). Вот и консалтинговые агентства согласны с тем, что, хотя прямой эффект оценить сложно, польза очевидна на всех уровнях и на всех рынках для широкого спектра задач.
Тем не менее можно отметить, что «Роскосмос» нацелен на развитие коммерческого применения данных и сервисов. Поэтому проект изначально создавался для обеспечения государственных потребителей с планами потенциального масштабирования и на бизнес, польза для которого от такой системы тоже неоспорима. К нам регулярно поступают запросы от коммерческих компаний, которые тоже хотят использовать возможности системы. Однако тут есть ряд нюансов — как нормативно-правовых, так и технологических. Для бизнеса нужны несколько другие продукты, хотя изначальный состав информации может быть похожим. А над решением нормативно-правовых вопросов сейчас работают специалисты «Роскосмоса», чтобы иметь возможность предоставить к системе коммерческий доступ, когда она будет готова к масштабированию. Поэтому сейчас бизнесу мы оказываем услуги на базе наших коммерческих разработок, не связанных с «Цифровой Землей».
- Каковы направления развития платформы?
А.Б.: Прежде всего требуется повышать автоматизацию. Ближайшие месяцы покажут, какие направления приоритетны. Перейти с 8 регионов на 20 и далее на 85 — это большой вызов. Здесь нужно понимать, что космические снимки — это очень объемная информация, для обработки которой необходимы достаточно большие мощности, соответствующие инфраструктуре. Поэтому мы не исключаем, что придется дорабатывать систему оптимизации ресурсов.
А.А.: Кроме того, алгоритмы прошли обучение не для всех регионов РФ — нужно увеличивать объем выборки. Будем дообучать имеющиеся и разрабатывать новые нейросети. У нас даже есть специальный инструмент, который автоматизирует сам процесс обучения. А дальше будем расширять номенклатуру геосервисов, делать их доступными для коммерческих потребителей, работать над повышением гибкости системы для пользователя. В итоге хотелось бы сделать возможным прямой доступ пользователей различной квалификации к облачному «конструктору» алгоритмов и продуктов.
Материал опубликован на портале Вестник цифровой трансформации CIO.RU