МГУУ


Управление государственной
службы и кадров
Правительства Москвы

МГУУ ПМ


Московский городской
университет управления
Правительства Москвы


06.12.2018

Big Data: московские госслужащие узнали, как и для чего управлять большими данными

Со стороны бизнеса и правительств сегодня наблюдается повышенный интерес к науке о данных (Data Science) и большим данным (Big Data). Развиваются технологии для сбора, обработки и анализа огромного объема информации, которую затем используют не только для отчетов. Создаются цифровые портреты клиентов и избирателей, прогнозируется будущее, формируются команды и профили лояльности клиентов. Как работать с большими данными и чем они могут помочь в городском управлении? Об этом госслужащим столицы рассказали на семинаре «Большие данные в современном городе». В нем приняли участие более 100 человек.

Объем информации в Сети стремительно растет. Масштаб и скорость ее обработки продемонстрировал проректор по повышению квалификации Университета Правительства Москвы Сергей Журихин.

«В 2022 году объем данных в интернете будет составлять более 44 зеттабайт. С чем это сравнить? Все пляжи земли содержат 700 500 000 000 000 000 000 (семь квинтильонов пять квадриллионов) песчинок. 44 зеттабайт превосходят это число в 57 раз. Чтобы представить себе этот размер, возьмем обычные жесткие диски для компьютера. Для хранения 1 зеттабайта требуется около 83 миллионов жестких дисков емкостью 12 терабайт. С одного жесткого диска на 1 зеттабайт можно 63 миллиона лет смотреть видео с высоким разрешением 4K. А 44 зеттабайта — это уже 3 652 000 000 жестких дисков и 2 772 000 000 лет в 4К», — сказал он.

«Big Data помогает предсказать будущее»

Более подробно о том, что же такое большие данные и как с ними работать, рассказала Наталья Полковникова — руководитель новых направлений Global Innovation Labs LLC, автор первых в России онлайн-курсов по обучению большим данным в АПК.

Big Data характеризуют пять элементов: объем (сейчас он превосходит то, что может обработать наш мозг), высокая скорость изменения данных, их разнообразие, достоверность и ценность.

Чего ждут от больших данных? На их основе делается предсказательная аналитика (поиск причинно-следственной связи). Можно спрогнозировать, как люди, техника, природа поведут себя в будущем. Например, большие данные могут быть предвестниками эпидемий. Есть сервисы, которые анализируют соцсети (посты, настроение, статус), ключевые слова в поисковике (какие лекарства ищут, способы лечения). Таким образом, можно понять, в каких районах пик заболеваемости. Эту информацию, к примеру, используют для активной рекламы лекарственных средств.

Большие данные помогают создать цифровой портрет гражданина (сколько энергии он потребляет в день, какое у него эмоциональное состояние, здоровье, что покупает и т. д.). Банки, например, выявляют сомнительных клиентов (с помощью больших данных анализируются платежи). HR-специалисты могут выявлять лидеров компании, подбирать команды, просчитывать ее слаженность и эффективность.

Город тоже видит и оценивает информацию о жителях. С проездных билетов, которые мы прикладываем в общественном транспорте, через камеры видеорегистрации, через сервисы госуслуг и т. д.

«Мы, например, работали с Департаментом науки и промышленности г. Москвы. Проводили анализ эффективности распределения субсидий. Мы взяли данные от компаний, получавших субсидии за последние 5 лет, и сделали идеальный профиль тех, кто может их эффективно использовать. Также выделили компании, которым не стоит давать субсидии», — рассказала Наталья Полковникова.

Она привела много примеров других стран, которые используют большие данные в госсекторе. Например, в Китае работает система оценки благонадежности. В США с помощью искусственного интеллекта повышают занятость иммигрантов, помогают им устроиться на ту работу, где они лучше адаптируются и выполняют свои функции эффективнее.

«Для начала мы должны накопить опыт и нужную базу данных, чтобы разрабатывать полезные рекомендательные системы жителям»

О том, как искусственный интеллект может помогать в управлении городом и стоит ли сегодня полностью полагаться на него, рассказала Мария Анисимова — заместитель руководителя продукта «Большие данные» Департамента информационных технологий г. Москвы.

«Применение искусственного интеллекта в решении городских задач не всегда является панацеей. Зачастую во всех промышленных решениях больше используются математические модели, таблицы в Excel (для предоставления оперативной отчетности и проверки гипотез) и, в редких случаях, нейросети. Почему? У них есть минус: непонятно, почему нейросетка приходит к тому или иному выводу, то есть остается неизвестным, какие факторы значимы. Это допустимо в анализе текстовой информации или изображений. Но, например, стоит задача выяснить, почему пациент пришел к одному терапевту, а не к другому. Нейросетка не даст ответа, почему. Таким образом, чтобы выбрать оптимальную модель прогнозирования, необходимо сначала конкретизировать итоговую цель, для которой вы разрабатываете решение», — сказала спикер.

Но при этом преимущества анализа больших данных очевидны. Он позволяет увидеть скрытые закономерности, незаметные человеческому восприятию. Это дает хорошие возможности оптимизации всех сфер жизни: государственного управления, медицины, безопасности, финансов, транспорта, образования и т. д. Большие данные могут обрабатываться в режиме реального времени, что повышает качество и скорость принятия решений.

Отдельно Мария Анисимова остановилась на теме накопления данных.

«Сейчас все хотят данные накопить впрок, и никто не знает, когда и где они понадобятся. 80% времени занимает нормализация, очистка, структурирование собранных данных, и далеко не всегда это можно решить IT-методами. Например, когда вы боту пишете какой-то вопрос, а он не может качественно найти на него ответ, это значит, что в базе данных нет накопленных ответов по этой тематике. Поэтому мы не можем использовать и выводить их жителям Москвы, т. к. репутационный риск намного выше. Для начала мы должны накопить опыт и нужную базу данных, чтобы на вопрос, куда сегодня пойти вечером, ответ от бота был полезным и расширенным».

По мнению участников, семинар помог расширить кругозор, узнать больше про Big Data, дал понимание, какие технологии используются в Москве для сбора, обработки и анализа данных и как это влияет на социальную и экономическую ситуацию. Некоторые отметили, что использование специальных сервисов для сбора информации о жителях может помочь повысить качество предоставляемых услуг.



Также по теме:


Все новости МГУУ