Версия для печати 1136 Материалы по теме
Исследования на данных: как совершенствуется государственная политика

В процессе своей цифровой трансформации и перехода на электронное взаимодействие с гражданами органы государственной власти становятся генераторами и владельцами огромных массивов данных о современном обществе и о процессах, протекающих в нем. Эта информация намного объемнее традиционной статистики, а ее анализ позволяет повышать эффективность принимаемых управленческих решений и системы государственного управления в целом. Но, чтобы получить ее, требовались значительные усилия.

Олег Александрович ПАНФИЛОВ, редактор портала «Инфраструктура научно-исследовательских данных»

Много времени и усилий

Возможность работать с данными из ведомственных информационных систем востребована в современных социальных науках: экономике, социологии, политологии, смежных дисциплинах. Однако получить доступ к таким сведениям исследовательским центрам непросто. Хотя большинство данных признаны открытыми и должны быть предоставлены для научных целей по прямому запросу, существуют технические ограничения, требующие определенного качества данных, без которого анализ становится невозможным.

Для работы с государственными данными, кроме прямого запроса, сегодня в России исследователь может обратиться к официальным сайтам и разделам «открытые данные», к статистическим данным Росстата, data.gov.ru, системе ЕМИСС и другим. Но даже все эти ресурсы не всегда позволяют получить все необходимые показатели, которые требуются для проверки исследовательских гипотез, так как зачастую данные нужны сразу из нескольких систем и совмещенные друг с другом.

Исследование административных данных принципиально для изучения современных процессов в обществе

Процедура запроса данных, как правило, отнимает много времени и требует больших усилий на подготовку как со стороны ведомства, так и со стороны исследователя, поэтому часто от нее отказываются. Хотя выгоду в итоге гарантируют себе обе стороны: в результате прикладного исследования у автора появляется научная работа, а у ведомства — доказательная основа для обоснования инициатив и принятия решений.

Генеральный директор Центра перспективных управленческих решений М. С. Шклярук подчеркивает: «Многие исследователи, уже работающие с государственными данными, отмечают сложность в получении доступа к необходимой информации, неудобный формат, отсутствие системы и методологии в подаче. Работать с таким сырым материалом сложно: для того, чтобы использовать его в исследованиях, необходимо дополнительно обрабатывать данные, это требует много времени и усилий».

Решение

Цифровая платформа «Инфраструктура научно-исследовательских данных» (ИНИД) призвана решать подобные проблемы и обеспечивать продуктивное взаимодействие между исследователями и владельцами данных о государстве и обществе для совершенствования государственной политики. Платформа разработана Центром перспективных управленческих решений (ЦПУР) в сотрудничестве с органами государственной власти: Росстатом, Рострудом, Минздравом, Счетной палатой РФ и другими. Запуск проекта состоялся 1 октября 2020 года. Здесь публикуются наборы данных от официальных владельцев, уже готовые для проведения исследований, в виде удобных плоских таблиц и баз данных.

Дата-аналитики ИНИД приводят полученную от партнеров информацию к машиночитаемым форматам, устраняют пропуски, ошибки ввода и связывают в один набор сведения из разных источников. К самому дата-сету готовят описание методологии сбора и сопроводительную документацию с информацией о значениях переменных.

Так, в каталоге ИНИД опубликована база данных муниципальных образований РФ (БДМО) Росстата; сведения о численности населения в населенных пунктах РФ с привязкой к географическим координатам и коду ОКТМО на основе данных региональных медицинских информационно-аналитических центров (МИАЦ); база данных проекта «Госрасходы» и другие. Сейчас на платформе представлено уже более 40 наборов данных по девяти направлениям: экономика, финансы, здравоохранение, международные отношения и т. д.

Г. А. Остапенко, заместитель руководителя Росстата: «Проект „Инфраструктура научно-исследовательских данных“ Центра перспективных управленческих решений является шагом на пути к построению эффективного диалога с экспертным сообществом. Росстат обладает массивами информации, позволяющими анализировать динамику, изменение показателей по ключевым социально-экономическим процессам. Сотрудничество с внешними экспертами, обладающими компетенциями в дата-анализе, дает новые возможности в представлении данных, их визуализации на специализированных площадках. С помощью обработки данных методами современного анализа государственные служащие смогут оперативнее просчитывать последствия выбора тех или иных решений и опираться на доказательные методы».

Д. А. Васильев, заместитель руководителя Роструда: «К нам поступает много запросов от научных организаций с просьбой предоставить те или иные сведения для исследовательских работ. Теперь у научного сообщества будет возможность ознакомиться с данными Роструда на специально созданной платформе... Отмечу, что все данные попадают на платформу строго после полной очистки от персональных данных».

ИНИД для исследователей и государства

Платформа не ограничивается размещением и хранением данных, полученных от партнеров. Ценность — в активном сотрудничестве с академическим сообществом, заинтересованным в анализе полученных данных. В число партнеров ИНИД на сегодняшний день входят Университетский консорциум исследователей больших данных, в составе которого объединены 28 вузов со всей России, подписаны прямые соглашения с Томским государственным университетом, РАНХиГС и Высшей школой экономики. Сотрудничая с ИНИД, эксперты получают возможность работы с ранее недоступными данными в кооперации друг с другом и представителями самих органов власти.

Примером того, как проект может напрямую помочь государству в решении конкретных задач, может служить онлайн-соревнование между командами исследователей, которое было совместно организовано ИНИД и Рострудом. Онлайн-хакатон PandemicDataHack прошел в декабре 2020 года. В течение трех дней аналитики данных, ИТ-разработчики, специалисты по машинному обучению, визуализации и продуктовые дизайнеры работали с актуальными государственными данными Роструда, чтобы найти решение для одной из поставленных ведомством задач.

— Мы получили гораздо больше заявок, чем предполагали, а сами команды продемонстрировали высокий уровень компетентности. Организуя хакатон, мы хотели показать, что работать с государственными данными может быть интересно, а главное — что в ходе хакатона появляются идеи, которые могут впоследствии стать основой новых решений и проектов в сфере труда и занятости, — отметила Шклярук.

Главной темой соревнования стало влияние пандемии COVID-19 на сферу труда и занятости в России. Победителями в финале стали 17 команд. Участники предложили решения для определения тенденций и влияния пандемии на рынке труда, работающие модели предсказания оценки стоимости навыков соискателей, заполнивших резюме на портале «Работа в России». К примеру, одним из решений стала модель по прогнозированию образовательной траектории для соискателя на основе его навыков и опубликованных вакансий. С помощью модели можно предложить соискателю образование для повышения компетенций или смены рода деятельности.

Международный тренд

Появление платформы в России отражает мировую тенденцию укрепления связей между государством и научно-исследовательским сообществом, а также все более активного применения административных данных для решения государственных задач. Например, проект из Великобритании UK Data Service (Служба данных Соединенного Королевства) был создан в 2012 году совместными усилиями нескольких крупных университетов страны в сотрудничестве с некоммерческим сектором. Средства на деятельность проекта выделил национальный совет по экономическим и социальным исследованиям, в свою очередь финансируемый государством. Служба данных, как и платформа ИНИД, предоставляет пользователям доступ к своим информационным ресурсам для того, чтобы поддерживать исследователей общественных наук. На сайте службы также действует раздел специального доступа к наиболее конфиденциальной информации.

Подобные проекты встречаются во многих странах Европы. Во Франции при поддержке национального Министерства науки и образования действует инфраструктура PROGEDO, чья миссия заключается в создании и управлении данными общественных наук. В Нидерландах подобные задачи выполняет проект DANS, в Германии — GESIS, в Португалии — APIS. Все вышеперечисленные проекты, включая британский, входят в CESSDA (Консорциум европейских архивов данных для общественных наук). Членами консорциума являются организации из 22 стран Европы. С представителями многих других государств континента CESSDA заключила соглашения о сотрудничестве.

Поддержка исследователей осуществляется не только в Европе. В разных форматах проекты, связанные с научными данными общественных наук, работают в Канаде, Израиле, Южной Корее, Австралии и других странах. Эти примеры лишь подчеркивают, что создание ИНИД в России — часть общемирового процесса, один из шагов перехода в новую, цифровую эпоху госуправления.

Поделиться