我院师生在第四届“慧源共享”全国高校开放数据创新研究大赛中斩获佳绩

发布者:信机学院网站管理员发布时间:2023-04-26浏览次数:25

近日,从第四届“慧源共享”全国高校开放数据创新研究大赛组委会获悉,我院的“从容应队”组(组员:卢亚芳,孙彬彬,张静逸,程灵娜,钟情婷,钟佳莱,冯娴睿)参赛项目《基于运营商数据的区域人口活力模型研究》,斩获三等奖,指导老师廉洁荣获优秀指导老师奖。这是学院师生首次在该项赛事中获奖。



在上海市教委和经信委的指导与支持下,第四届“慧源共享”全国高校开放数据创新研究大赛,于2022929日正式启动。本届赛事旨在聚焦赋能数据素养教育,推动和促进教育科研领域数据资源的汇聚流通和共享开放。全国共有435支队伍报名参赛,共有101项作品进入专家盲审环节,最终有15支队伍进入答辩环节。



 “从容应队”组的七位组员分别来自2020级的计算机科学与技术、人工智能、计算机师范专业,其中2020级计算机科学与技术专业卢亚芳同学担任组长。同学们在一次偶然的机会中看到了学校图书馆公众号平台转发的慧源数据大赛信息,大赛所有数据均来自官方,并且数量庞大。对于在校大学生来说,很少有机会可以接触到如此正规、信息含量大的数据集,几位同学感到这将是一次非常难得的锻炼机会,可以将数据挖掘课上讲授的一些数据处理、机器学习、分类预测等方法运用于实践。

在廉洁老师的指导和鼓励下,组员们在这次比赛中投入了极高的热情和专注,从决定参赛的那一刻起,就开始了一场不断探索、持续学习的旅程。通过查阅往年相关获奖情况和数据集的特点,团队最终选择了上海市运营商数据,确定了通过手机信令数据来刻画上海地区的区域人口活力这一既有意义又有挑战的研究主题。之后在论文撰写的过程中,她们查阅了大量资料,运用了《数据挖掘》课上学习的多种算法,不仅提取出了影响活力的主要因素,还给出了一些具有指导意义的建议,对于城市规划、交通管理等方面都有借鉴价值。



比赛的过程并非一帆风顺,从确定主题、选择模型、分析原因到给出结论,这期间有过迷茫、困惑,也有看到希望的喜悦,有过意见的分歧,也有统一意见后的协力合作。就像组员程灵娜所说:“参赛前期我们一有空闲时间就会预约研讨室,一起构思对于现有的数据集的研究方向,但是一般最后都没有一个比较满意的结果,经常以疲惫、垂丧收尾。那几天我们小组成员都很辛苦,就是身心俱疲但实际又没有什么产出,有很大的挫败感。好在终于有一天我们达成了一致确定下来了研究方向、开始小组分工作业。我们经常一起在活动室讨论到很晚,虽然过程很曲折,但好在我们都坚持了下来。”比赛结束后,钟倩婷深深感慨,“只管全力以赴地去做,努力总会结果。”

参赛同学们在丰富经历的同时,都收获了丰硕的成果。组长卢亚芳同学表示,“经过此次竞赛,我认为大数据蕴含的能量是巨大的,同一份数据集在不同的人手上可以有不同的研究,如果数据只是数据,那将毫无意义。我们要做的就是探索数据背后的故事,以小见大,用代码为社会进步绘制更美好的蓝图。”

孙彬彬同学表示,“奋战了多个日夜,当我们将所有的想法、成果最终汇集在一篇论文中时,我们知道这几天的努力和辛苦是值得的。比赛追求的总是获奖的荣誉,留给我们最宝贵的是团队合作的经历和分析问题,解决问题的能力。”

张静逸同学说到,“在备赛和比赛过程中,我学到了很多数据分析经验和技巧。这次比赛不仅让我收获了知识和技能,也认识到了自己的不足和需要改进之处。”钟佳莱则表示,通过参加比赛,自己深刻理解了数据分析对于城市规划与发展的重要性,也体会到了数据分析的乐趣和挑战。

冯娴睿负责海报制作,她做了大量准备,并且参考了近两年的获奖海报,从中学习经验,“虽然一张海报没有多大,但是要放的内容确是很多的”,通过制作海报,“学习到了很多新的知识”。



此次参赛,得到了学校图书馆的大力支持,尤其在赛程赛制、团队构建、现场答辩等方面,图书馆的老师们给予了精心指导。

(供稿、摄影:信息与机电工程学院)