MOOC课程论坛中学习者论坛交互网络结构特征分析

  • 投稿vior
  • 更新时间2015-10-09
  • 阅读量285次
  • 评分4
  • 44
  • 0

徐彬1,张 昱1,李 封1,杨 丹2

(1.东北大学计算中心,辽宁沈阳110819;2.东北大学信息科学与工程学院,辽宁沈阳110819)

摘要:分析学习者在课程论坛中的交流互动行为记录,根据不同的行为特征对学习者进行分类并进一步构建一个学习者之间的交流互动关系网络,利用社会网络分析方法阐述节点用户的网络结构特征。以Coursera平台的课程论坛数据进行实验分析,指出当前MOOC平台的课程论坛中,用户参与度的提高对促进学习者更好地完成课程学习具有积极的作用,但当前MOOC课程论坛的用户参与度还有待进一步提高。

教育期刊网 http://www.jyqkw.com
关键词 :在线课堂;教育数据挖掘;社会网络分析;行为特征

文章编号:1672-5913(2015)15-0023-04 中图分类号:G642

基金项目:中央高校基本科研业务费专项基金资助项目( N130404004);辽宁省科技公关资助项目(2013217004-1)。

第一作者简介:徐彬,男,讲师,研究方向为现代教育技术、社交网络分析,xubin@mail.neu.edu.cn。

0 引言

大规模开放在线课堂( massive open onlinecourses,MOOC)为人们提供了免费学习世界顶尖高校优秀课程的机会,迅速引起全世界数千万人的关注。目前,美国的Coursera、edX和Udacity被认为是MOOC的三大平台,而来自欧洲和亚洲的很多国家也纷纷开始建设自己的MOOC平台,引发全球的在线教育大浪潮。截止2015年1月,已有超过1 000万用户注册Coursera平台。在MOOC课程中,数以万计的学习者共同学习同一门课程,彼此成为“同学”关系。然而,与传统课堂中的同学关系相比,MOOC课堂中的“同学”之间互不相识,甚至空间距离上远隔万里。只有在课程论坛中,学习者之间才有机会相互交流,才能使这种“同学”关系得到加强。参与课程论坛讨论的学习者之间形成的关系网络有什么特点?这种关系网络与学习者在课程中的持续学习时间有何种联系?研究这一关系网络的结构特征将有助于分析MOOC课堂的低完成率问题。

1 相关研究

社交媒体的广泛应用为用户之间的相互交流带来了新的途径。社会网络分析的方法也为发现和分析高等教育中出现的问题提供了新的手段。文献[1-2]分析Twitter平台中学生就课堂教学而展开的讨论留言或分享的评价与心得,总结学生在课堂中的学习体验与需求;文献[2]还利用社交媒体中的消息内容分析发现MOOC课程平台设计的不足,以指导平台的设计优化;文献[3]通过分析学生在人人网中的互动活动挖掘其线下的潜在好友关系;文献[4]研究发现在MOOC平台中学习者之间的交流体现了社会协作性;文献[5]以众包的方式将MOOC课程论坛中的发言从6维度上进行人工标记,如“该帖子是否是一个提问”“该帖子是否是一个解答”“该帖子的困惑级别是什么”“该帖子的紧急程度如何”等。这些人工标记的信息加上帖子内容( postbody)及头数据(metadata)构成特征空间,利用分类器组合方式识别学习者对课程内容的困惑程度。文献[6]通过分析6个班级学习者的观看视频、提交作业等基本学习行为,将学习者分为5类:观看者、解决者、全能者、收集者和旁观者。文献[7]通过分析学生在课程论坛或者课程Wiki中的活动,将学生分成4类:被动参与者、Wiki贡献者、论坛贡献者和完全参与者。文献[8]尝试从认知规律对学习者进行划分,将其分为打酱油者、虎头蛇尾者、摇摆不定者、坚持完成者和只为学习者。文献[9]给出一种自动标注课程论坛中问题的方法,以帮助主讲教师及时发现并回复问题。文献[10]指出更多学习者之间的交流合作有助于提高学习效果。

2 学习者论坛交互网络构建

2.1 学习者的论坛活动角色

课程论坛是Coursera平台中为课程学习者提供的在线交流场所。在课程平台中,论坛分为版块、线程、帖子和评论4个层次。其中,版块将讨论内容分为若干个大类,如综合讨论区、课程讨论区、作业讨论区等,学习者在各个版块中可以创建线程,类似于发起一个新的话题,通常木同的线程对应不同的问题。在线程中,学习者可以通过发布帖子或者评论他人帖子等活动,就线程所设定的特定问题进行讨论。

笔者以Coursera平台的真实数据展开研究。首先设计一个爬虫程序,通过API调用方式采集“统计与数据分析”( statistics and data analysis)类别下10门课程的论坛数据,所选课程开课时间超过7周或者已经完结。采集的数据包括课程基本信息、用户基本信息以及论坛信息,其中论坛信息包括线程、帖子和评论3个级别。各项数据分别建立对应的数据表存人数据库。此外,笔者还采集了论坛3个级别信息之间的隶属关系,最终得到的实验数据集基本统计指标见表1。

根据学习者在论坛活动中的角色,教师可以将学习者分为3种:线程发起者(发起一个新的线程,提出一个新的问题)、帖子发布者(在线程中表达一个新的观点)和帖子评论者(针对已有帖子发表评论)。进一步地,同一学习者可以既是线程发起者,又是帖子评论者,甚至3种角色同时存在。在论坛互动过程中,用户之间逐渐形成一个关系网络,关系边的建立并不是由于双方的好友关系,而是由于双方就某个问题的交流。在线程中,所有帖子发布者与线程发起者之间、某个帖子的所有评论者与帖子发布者之间都存在显式的交流关系。笔者同时假设在一个线程下的所有帖子评论者与线程的发起者之间也存在一个隐式的交流关系,如图1所示,其中关系边E.和E2是显式的直接边,而关系边E3是隐式的间接边,由此构建一个有向关系网络。

2.2 网络中节点的行为特征属性

学习者在课程论坛中的活动以问答行为为主,因此所构建的网络是一个表征学习者相互问答行为的关系网络。在这一网络中,学习者就课程某个问题的交流而形成关系边,因此这种关系边本质上隐含了一个问答关系。MOOC课程的论坛更类似于问答平台,差别在于普通问答平台的问题涉及很多方面,这里的问答内容集中在课程相关的主题。在交流过程中,有些学生提出很多问题,但是却很少回答别人的问题;有些学生则乐于解答别人提出的问题。这虽然受限于学习者的知识水平,但是从行为模式角度考虑,并不是所有有能力回答别人问题的学习者都乐于解答别人的问题。因此,我们从学习者行为模式角度分析学习者在论坛中的问答行为,将学习者划分为提问型Q、回答型A和交叉型C三大类别[11]。为了提高网络密度,我们仅选取论坛活动中发布消息数量大于1的用户作为有效的活跃学习者进行分析。有效活跃学习者数量及三大不同类型的用户数见表2。

2.3 网络关系边的强度计算

如前所述,所构建的网络中,关系边分为直接边(E1,E2)和间接边(E3)。同时,节点根据行为特征可分为提问型Q、回答型A和交叉型C三大类,由此可得到关系网络中27种不同的关系边类型,见表3。

在所构建的关系网络中,不同的关系边类型对关系边的强度作用不同,因此我们建立一个与表3对应的关系边权重矩阵W,矩阵的维度为3x3;同时,我们假设网络节点之间关系边的强度由节点之间的关系边类型和两个节点之间交互的次数共同决定。对网络中任意两个节点m和n,由节点m指向节点n的关系边强度可根据式(1)进行计算。

这里,Ⅳ是由节点m指向节点,z的关系边总数,wij是关系边权重矩阵W中的元素,其取值为1、2、3,分别对应Q型、C型和A型学习者。

在论坛交互活动中,还存在论坛用户在自己所发布的线程Thread或帖子Post中追加评论的情况,由此形成一部分自我关系边。分析过程中,我们删去了这部分自我关系边。综上所述,最终所构建的论坛交互网络是一个具有节点属性的有权有向网络。

3 学习者论坛交互网络结构特征分析

3.1 网络整体结构特征

我们利用社会网络分析软件对所构建的交互网络进行结构特征分析。网络的基本结构特征数据见表4。

从表4可以看出,网络密度值很低,说明在Coursera平台的课程论坛中,学习者之间的相互交流较少。这是由于这种关系边与社交网络中的好友关系不同,交互关系的形成存在更多的随机性。网络的平均度特征值为3.44,说明论坛中每个问题所对应的回复帖子的不同学习者并不多或者一个问题在经过几个回复后就已解决。网络的强联通子图虽然较多,但是最大的强联通子图仅包含37个节点,意味着网络中只有少量节点之间存在双向互动关系。利用社区发现算法[12]对该网络进行模块性计算,社区数为41个,社区规模如图2所示。可以看出,超过半数的社区节点数低于100,说明论坛交互活动以小范围的讨论为主。在最大的社区中,节点数为1125,该社区属于Coursera平台创始人Andrew NG所开设的机器学习课程。

3.2不同行为特征学习者的网络特征

在所构建的网络中,首先计算网络节点的度特征。该网络的平均度为3.44,最大出度为455,最大人度为198,最小人度和最小出度都为1。根据之前建模得到的用户问答行为模式,我们将用户分成Q、C、A三大类分别计算各组节点的平均入度和平均出度,得到的结果如图3所示。可以看出,Q组用户具有更高的入度,而A组用户具有更高的出度。这是由于Q组用户倾向于提出问题,而更少参与回答他人的问题;A组用户则更乐于回答他人的问题,使得其网络出度也更高。

进一步地,按照相同的人度和出度对用户进行分组,然后计算相同组的平均持续学习时间。由于无法获取用户实际的持续学习时间,笔者假定某个用户的持续学习时间为从该用户第一个帖子开始到最后一个帖子结束,即以用户在论坛中的活跃时长作为该用户的持续学习时间。我们发现,节点的出度越高,学生持续学习时间也相对较长,这是由于节点出度与学习者解答他人问题的次数相关。如果学习者解答更多的问题,就表明其对课程的掌握程度越好,学习成就感也越高,同时也有助于保持学习积极性。

4 结语

研究结果表明,在MOOC课程论坛中,实际参与课程论坛的用户仅占课程注册人数的一小部分,而其中有效的活跃用户比例则更小。另外,对实际的课程论坛活跃用户活动的分析表明,提高课程论坛中的活跃度有利于帮助学生更好地完成学习。在当前的MOOC平台中,课程论坛的作用尚未很好地发挥,如何吸引更多的学习者加入课程论坛讨论有待于进一步深入研究。