Вы здесь

Использование данных цифровой образовательной среды: основные каналы и персональные траектории

Цифровое образование — это направление, которое аккумулирует внутри себя большой объем данных. Использовать их можно по-разному: на пользу ученикам и преподавателям, для развития образовательной платформы в целом и для исследовательских задач. Но как именно работают с большими данными в образовательной среде и какие существуют сложности? 

Источник данных

Можно выделить два основных канала, которые могут быть задействованы в образовательной экосистеме для получения данных. Первый — те, что получают с помощью датчиков из физической среды: например, количество студентов в аудитории (через счетчики или на основе анализа видео с камер наблюдения и систем распознавания лиц), количество пришедших и ушедших, объем углекислого газа в час. Это то, что называется пространствами на основе IoT, интернета вещей. 

Сейчас датчики похожим образом широко используются в торговых центрах: эти устройства есть на входе во многие магазины. Они считают количество человек, которые вошли и вышли, подключаются к мимо проходящим посетителям с включенными Bluetooth и wi-fi на смартфоне, рисуют карты перемещений человека по торговому центру на основе mac-адреса мобильных телефонов и используют все эти данные для анализа поведения потенциальных покупателей. 

Второй канал — данные, которые пользователи оставляют в цифровой образовательной среде. Например, как быстро мы проходим тесты, в какой последовательности решаем задачи, какими предметами больше интересуемся, на что кликаем и так далее, — в зависимости от того, как настроена программа. Этот пример хорошо знаком нам по социальным сетям: чем больше данных получает система, тем лучше она может настроить персональные рекомендации для пользователя. Важно понимать, что и первый, и второй канал данных в конечном итоге оказываются собраны в цифровом виде — а значит, работа с ними выстраивается схожим образом.

Облачные базы данных

Образование становится цифровым: школы переходят на электронные дневники, а университеты поддерживают собственные образовательные платформы. Но не каждое образовательное учреждение может позволить себе собственные серверы для хранения и обработки данных студентов и специалиста для администрирования инфраструктуры. В этом случае альтернативой становятся услуги облачных провайдеров, в частности облачные базы данных. Такое решение позволяет хранить данные на виртуальных машинах, не заботясь о безопасности и безотказной работе — за этим проследит провайдер. Также это поможет сэкономить за счет автомасштабирования баз данных: число ресурсов увеличится в горячую пору сессий и уменьшится в каникулы. Хороший пример такой услуги — облачные базы данных от Selectel.

На пользу ученикам и образовательным платформам

С одной стороны, многие образовательные онлайн-платформы работают подобно тому, как устроены социальные сети. Они умеют анализировать прогресс, составлять отчет активности, рекомендовать дополнительные программы на основе личных интересов, — от этого выигрывает в первую очередь сам учащийся. Программа Knowre [2], например, с помощью машинного обучения ищет пробелы в знаниях студентов и помогает им подтягивать математику.

В то же время онлайн-школы ведут подсчет пользователей, которые прошли курс до конца, зарегистрировались и выбрали тот или иной контент. Эти знания помогают развиваться самой платформе: строить новые стратегии, разрабатывать инструменты и продукты. Например, в Университете Карнеги-Меллона в США есть [3] онлайн-школа с курсами, которая предоставляет студентам подробный отчет об их успехах. Результаты показали, что детальные отзывы и возможность посмотреть на анализ своей успеваемости почти в 2 раза ускорили срок прохождения онлайн-курсов.

Похожих примеров довольно много. Университет Пердью в США запустил [3] у себя систему аналитики, которая собирает демографические данные студентов и информацию об академической истории и активности. На основе этого рассчитывается уровень риска оказаться отчисленным. Показатели периодически направляются координатору курса и самому студенту. Благодаря этой системе удалось улучшить результаты обучения и снизить показатели отсева.

В исследовательских целях

Также очевидно, что распространение систем цифрового обучения дает значительно больший объем информации для ученых и исследователей. Анализ образовательных данных проводится для того [4], чтобы лучше понять, как люди учатся. Сюда входит и прогнозирование поведения учащихся, и разработка новых моделей представления знаний, и изучение эффектов взаимодействия между преподавателями и учениками, и развитие знаний о самом феномене обучения. Кроме того, анализ образовательных данных помогает развитию теории обучения, которой занимаются специалисты в области психологии образования.

Например, ученые из Университета Каплан в США провели [5] исследование, которое охватывает около 1000 различных онлайн-курсов и 60 000 студентов. Исследователи задались целью понять, как различные характеристики учащихся соотносятся с показателями их отсева. Учитывались возраст, пол, семейное положение и другие параметры. Анализ показал, что ученики старше 45 лет бросают учебу чаще, чем их более юные сокурсники. При этом служащие в армии и состоящие в браке студенты имеют более низкий процент отсева, чем гражданские и не состоящие в браке. 

Еще одно [6] исследование из университета Форт Вэлли проводилось с целью определить, существует ли статистически значимая разница между успеваемостью тех, кто занимается очно и в режиме онлайн. Анализ не показал существенной разницы между первыми и вторыми. Также не была выявлена значительная разница между этими двумя группами в зависимости от пола. 

На основе подобных работ можно строить учебные программы, которые с большой вероятностью пройдет больше учеников; добавлять стимулирующие активности в программу для тех категорий, которые отсеиваются чаще. В конце концов, можно глубже изучать причины, по которым люди не заканчивают начатые курсы — и менять программу так, чтобы они оставались до конца.

При этом выводы, полученные на основе подобных исследований, как правило специфичны [4]: они тесно связаны с образовательной организацией или регионом, в которых проводился сбор данных. На итоговую картину могут влиять культурные особенности, образовательные традиции выбранной территории и другие факторы. По этой причине без серьезных оговорок такую информацию нельзя переносить на другие образовательные организации или регионы. 

Защита личных данных

Важно понимать, что при проведении любых исследований происходит деперсонализация данных. Это означает, что ученые могут получить только обезличенные результаты: например, данные о том, что 32% пользователей неких онлайн-школ справляются с заданиями тем или иным образом, а 65% предпочитают проходить курсы в вечернее время суток. А вот раскрывать персональную информацию о ком-либо запрещено, это регулируется Федеральным законом 152-ФЗ. 

Однако и в рамках образовательной организации данные могут использоваться по-разному, не только для построения персональной образовательной траектории. Пока работа с данными в образовании — сравнительно новое направление, которое не имеет до конца выработанные этические и правовые рамки, и это порождает ряд трудностей. Главное правило: администраторы учебных курсов, использующих анализ образовательных данных, должны предварительно информировать пользователей о том, как и кто будет использовать их данные.

Кроме того, важно гарантировать конфиденциальность персональных данных — и результатов их обработки. В августе 2021 года произошел [7] скандал в компании Xsolla: появилась информация о том, что руководство задумало уволить 150 человек из списка, сформированного алгоритмом. Нейросеть посчитала, что те сотрудники, которые редко пользуются внутренними программными продуктами, неэффективны и не вовлечены в работу компании. Чтобы подобные случаи не происходили, стоит рассмотреть запрет на использование данных для оказания психологического давления с любой стороны. Также может быть полезен и запрет влияния полученных данных на заработную плату преподавателей и стипендию обучающихся. Кроме того, для получения высокой достоверности каких-либо результатов необходимо вести сбор данных продолжительное время — недели, месяцы и годы

Технический аспект

Прежде чем анализировать данные из цифровой образовательной среды, важно решить несколько технических проблем. Особенно если собранных данных много: правильное хранение и управление ими может потребовать определенных усилий.

В первую очередь важно обеспечить сохранность данных. Утечки из цифровой среды — вопрос актуальный и близкий всем. Почти каждый сталкивается, например, со звонками от посторонних организаций или даже мошенников. Они могут знать, что у вас есть карта в определенном банке, или то, что ваши недавние поисковые запросы были связаны с покупкой того или иного товара. 

Первый риск для образовательной организации, связанный с утечкой данных, — репутационный. Ведь если произошел взлом и об этом инциденте известно, он может сказаться на ее дальнейшей судьбе: будут меньше доверять и она не произведет набор, как следствие не получит необходимого финансирования и т. д. Второй риск — давление на людей. К примеру, если из системы украли электронные журналы, для самой организации это не страшно: всегда можно восстановиться из резервной копии и продолжить работу. Однако украденные сведения могут быть использованы против обучающихся.

Защита данных

Обеспечение безопасности данных — сложная техническая задача, поэтому образовательные организации часто прибегают к услугам профессионалов. Такие компании должны охранять свои дата-центры, контролировать физический доступ к серверам и использовать оборудование, которое соответствует требованиям федерального закона 152-ФЗ “О персональных данных”. Для этого существуют аттестованные ЦОДы и специализированные серверы для 152-ФЗ.

Новая нефть

В современной экономике данные представляют огромную ценность: они позволяют лучше и эффективнее продавать свои продукты — товары, услуги; оптимизировать их, делать так, чтобы люди обращали на них внимание, удерживать клиентов. Цифровая образовательная среда — не исключение: данные об учениках и преподавателях можно использовать и для того, чтобы повышать качество образования, и для того, чтобы делать процесс более приятным и удобным. 

Но прежде, чем оптимизировать уроки, важно системным образом выстроить работу с личной информацией учеников и преподавателей: с одной стороны, обеспечить техническую базу и безопасное хранение информации, с другой, информировать всех участников процесса об обработке данных — и заручиться гарантиями того, что результаты анализа будут использованы только во благо.

Литература

  1. Облачные базы данных, за которые не надо волноваться // Selectel
  2. Knowre Math, Problem Solved // knowre
  3. Аналитика больших данных и Machine Learning в образовании: 5 кейсов из ВУЗов
  4. Белоножко П.П., Карпенко А.П., Храмов Д. А. Анализ образовательных данных: направления и перспективы применения. 2017
  5. David Niemi and Elena Gitin. USING BIG DATA TO PREDICT STUDENT DROPOUTS: TECHNOLOGY AFFORDANCES FOR RESEARCH. 2012
  6. Jasmine Paul and Felicia Jefferson. A Comparative Analysis of Student Performance in an Online vs. Face-to-Face Environmental Science Course From 2009 to 2016. 2019
  7. Из российской ИТ-компании массово увольняют сотрудников по совету Big Data 
  8. Аттестованный сегмент ЦОД // Selectel

Алексей Заславский