近日,由卡耐基梅隆大学、北卡罗莱纳州立大学、匹兹堡大学和赫尔辛基大学等联合举办的第二届国际计算机教育数据挖掘大赛上,由大数据学院博士研究生沈双宏、少年班学院大数据专业本科生刘子瑞、计算机科学与技术学院本科生靳浩然共同组成的BDAA-BASE队伍在所有四个赛道中获得三项冠军、一项亚军的优异成绩!指导老师是认知智能全国重点实验室、大数据分析与应用安徽省重点实验室的陈恩红与刘淇教授、黄振亚副研究员等。
本次大赛自去年10月1日启动以来,整个赛程历时7个月。大赛吸引了一百余支来自世界各地的队伍参赛,包括美国UIUC等著名高校团队,以及好未来等知名智能教育领域的企业团队。本次大赛分为两个阶段:2021年10月1日至2022年2月6日为跨学期预测阶段,2022年2月7日至2022年5月1日为学期内预测阶段,参赛者需要用学生们在不同阶段的编程记录来解决编程学习中两个十分关键的问题:
1)知识追踪问题。该问题需要建模学生编程过程中知识水平的变化,并预测准确的预测出学生未来的编程表现。知识追踪是智慧教育领域内最困难的基础性问题之一,其目的是准确理解并动态追踪学生知识水平的演化,是实现智慧教育中个性化学习、精准教学推荐的基础和前提。团队在智慧教育的知识追踪这一重要研究方向已开展了近十年的研究,在KDD、SIGIR、AAAI、ICDM等人工智能顶级会议上发表相关论文十余篇,具有广泛的影响力。此前,团队成员就已经在机器学习领域的顶级会议NeurIPS 2020“教育挑战赛”学生答题选项预测任务中获得冠军。除此之外,团队成员还曾包揽了2020MOOCCube“学生行为分析挑战赛”的前三名。在本次比赛中,本团队将核心放在编程题目和学生编程行为的理解和建模上,提出基于人工智能技术和多维度特征分析融合的解决方案,包揽了第一阶段和第二阶段的两个冠军。值得一提的是,在所有的参赛团队中,我们是唯一能将AUC指标突破0.8的队伍。
2)成绩预测问题。该问题需要通过学生的早期表现(例如期中的时候)去预测出学生最终的期末考试成绩,从而提前做出学情预警。这个问题可以看作知识追踪问题的衍生,其核心仍然离不开对学生知识水平的建模。和知识追踪任务不同的是,针对期末成绩预测问题,本团队将核心放在学生学习行为模式的挖掘上。例如,相比如平时做题较慢的同学,能更快答对问题的学生有更大概率获得更高的期末成绩。在该任务上,我们最终斩获一项冠军、一项亚军的优秀成绩。
图1 获奖公示(链接https://sites.google.com/ncsu.edu/csedm-dc-2021/winners)
加快推进教育数字转型和智能升级、大力发展智能教育已经成为我国建成现代化教育强国的重要战略之一。围绕教育数字化、智能化的发展战略,实验室在“人工智能+教育”领域拥有扎实的理论和实践基础,在国际知名学术期刊和重要学术会议发表了一批高水平论文,并获多个国际会议的最佳/优秀论文奖、吴文俊人工智能科技进步一等奖(面向智能教育的自适应学习关键技术与应用研究)。此外,利用智能科技和信息技术推动教学模式创新,研发了具有高稳定性的教育资源分析系统、学生认知能力诊断模型以及个性化学习推荐系统等,并通过与科大讯飞公司等开展产学研合作研发的相关平台为全国范围内的多所中学师生提供精准、便捷的智慧教育服务。
未来,实验室将继续深耕智慧教育方向,积极助力国家教育数字化战略实施。一方面围绕教育资源的深度表征理解、学生认知诊断、教育知识图谱构建、教育知识推理等多个研究领域进一步探索,夯实理论基础;同时采用联合研发、自研孵化、跨领域合作等多种方式积极进行产业化落地,使得学术研究成果能够应用到实际的教学、学习场景中,提升教师的教学效率,学生的学习效率,做到行知合一,产生积极的社会价值。
图2 大数据分析与应用安徽省重点实验室智能科教组合影
(大数据学院)