您当前的位置:首页 >  讲话致辞 >  领导讲话稿 > 内容

情感指数对MOOC学生成绩的预测研究

无忧文档网    时间: 2019-11-10 06:23:08     阅读:

http://img1.qikan.com.cn/qkimages/dxjx/dxjx201905/dxjx20190513-1-l.jpghttp://img1.qikan.com.cn/qkimages/dxjx/dxjx201905/dxjx20190513-2-l.jpghttp://img1.qikan.com.cn/qkimages/dxjx/dxjx201905/dxjx20190513-3-l.jpghttp://img1.qikan.com.cn/qkimages/dxjx/dxjx201905/dxjx20190513-4-l.jpghttp://img1.qikan.com.cn/qkimages/dxjx/dxjx201905/dxjx20190513-5-l.jpghttp://img1.qikan.com.cn/qkimages/dxjx/dxjx201905/dxjx20190513-6-l.jpg
  摘 要:MOOC学生情感状态与学习成绩间的关系有助于教师了解学生学习状况并优化教学设计,但少有深入研究。本文用文本分析法定义并计算了一门中文MOOC课程学生的“快乐指数”和“痛苦指数”,发现“快乐指数”与成绩无显著关联,而“痛苦指数”能显著、正向地预测成绩,是MOOC课程的挑战度指数。MOOC平台可设置实时反馈机制,将“痛苦指数”等数据提供给教师,方便及时、针对性优化教學或者提供翻转。同时,“痛苦指数”有潜力成为鉴别MOOC中“水课”的指标。
  关键词:情感指数;学业表现;MOOC;文本分析;挑战度;水课
  MOOC(Massive Open Online Course)全称为大规模开放式在线课程。自2012年MOOC元年后[1],MOOC发展迅猛,三大平台Coursera、Udacity、edX与世界高校合作,使MOOC席卷全球。在中国,2013年前MOOC相关论文在国内期刊上仅发表5篇,但到了2016年,这一数字变为2420篇[2]。与传统课堂相比,MOOC的核心优势是跨越了空间局限,也使学习时间更加灵活,因而促进了优质教育资源共享。MOOC也面临许多问题,高辍学率①
  是其中最严峻的一项。根据美国宾夕法尼亚大学统计,MOOC平均辍学率高达90%[3],这不免让人对其教学效果产生疑问。因此,优化课程设计以提高学生学习动机、增加学习主动性并通过考核,成为MOOC发展的当务之急。
  课程设计优化需要清楚地知道哪些变量影响学生学业表现。蒋卓轩等发现,学生观看课程视频及提交小测验的次数能预测课程完成
  率[4];Yang等证实学生论坛发帖数与辍学率关系密切[5];Ramesh等的研究表明,学生参与课程的行为类型能显著预测成绩[6]。
  目前,少有研究关注MOOC学生的情感状态是否能预测成绩。按照维果斯基“最近发展区”理论,学生的发展水平有两种,一种是学生自身所能达到的水平,另一种是通过教育所能达到的潜在水平,两者间差异即为最近发展区。教育应向学生提供有难度、有挑战的教学内容和教学要求以激发学生潜能,使学生到达或超越最近发展区。MOOC课程为高等教育课程,本质上属于高深学问。学生要想在期末考核中取得好成绩,需在学习过程中迎接挑战、投入更多精力,也因此体验更多痛苦情感。本文假设:在MOOC学习过程中学生体验的痛苦情感越强,越可能取得较高成绩。
  传统课堂中,教师潜意识中通过观察学生面部表情、肢体语言了解学生情感状态反馈,并据此调整语速、讲解重点及改变提问策略,其过程异常迅速。越有教学经验的教师对课堂中学生情绪反应的判断越迅速和准确,后续教学调整也更有针对性和效率。相比传统课堂,MOOC中教师授课主要是提前录制视频并上传平台,学生通过观看视频学习,教师讲授过程相对固定。此外,MOOC并不能全面、广泛提供翻转课堂以方便线下讨论,师生间少有后期面对面交流。除课程视频外,教师与学生、学生与学生之间唯一可以交流的场景为在线课程论坛。学习越投入、越期待通过考试的学生,越可能就学习中遇到的问题参与讨论,于是论坛发帖成为实时分析MOOC学生情感的一个可靠数据源。
  本文基于一门中文MOOC的论坛数据,以大数据分析中的文本分析法提取学生情感信息,基于选定的情感词典统计论坛讨论中学生发布的积极、消极情感词语及词频,据此计算“痛苦指数”和“快乐指数”,通过回归分析检验情感指数是否能有效预测成绩。
  一、研究数据及方法
  1.数据
  本文数据源自北京大学在Coursera上开设的MOOC课程“计算概论A”,该课程开始于2014年9月,截止于2015年1月,共14 855名学生注册。所有学生中90.9%辍学(没有期末成绩);9.1% 的未辍学学生中,仅1%及格,0.5%成绩超过85分。在课程论坛上,450名学生参与讨论,发布了3 864条帖子,共526 083字;平均每名学生发帖9条,共826字,其中最活跃学生发帖201条,共25 239字。在所有辍学学生中,仅2名在论坛上发言;在所有未辍学学生(共1 347名)中,434名在论坛上发言,其中及格学生有116名,占所有及格学生(共148名)的78.4%。
  2.方法
  (1)文本分析中的情感信息挖掘
  人的情感与行为紧密联系,情感因素因而逐渐被金融、教育等领域学者关注[7-10]。随着大数据时代来临,互联网上积累了大量文本,如新闻稿、论坛发帖、微博等,这些文本成为分析情感信息的良好数据源,利用文本分析进行情感挖掘逐渐成为热点。与教育研究中衡量学生情感状态的问卷法相比,文本分析优势有两点[7]:首先避开了问卷法中学生自我评估的缺陷。自我评估一般事后完成,并非即时,其过程与结果受诸多不确定因素干扰,所得出的情感信息可信度较低;其次,基于积累的文本可以灵活分析一段时间内学生的情感信息,而问卷法仅能评估学生填写问卷时对学习过程情感的回忆,且掺杂填写问卷时的个人情感状态。
  文本分析进行情感信息挖掘的方法主要有两类。
  第一类是机器学习法。应用时可分三步:第一步,准备好一组打好情感标签的文本。第二步,对文本量化处理。量化过程视不同语言而定,若分析中文文档,需首先运用自然语言处理的分词模型对文档分词;若分析英文文档,因文字自然被空格隔开而无须分词处理。之后,应用文本量化模型将文档转换成向量,常用模型为词包模型(bag-of-words)。假设文档集合对应的词汇表中包含m个词语,运用词包模型将每篇文档转换为一个m维向量,每个分量的值对应一个词语权重。计算词语权重的方法主要有三种。第一种,将词语权重赋值为0或1,指代词语是否在文档中出现;第二种,将词语在文档中出现的频次设为权重,强调频繁出现词语的重要性;第三种,按照词频—逆文档频率(term frequency-inverse document frequency)计算词语权重,权重为两部分乘积:一部分是词语出现频率,即词频除以文档长度;另一部分是逆文档频率,即计算总文档数与包含具体词语的文档数之商,再取对数得出。词包模型仅考虑词语自身而忽略词语顺序(即语境信息),在一些文本分析中表现不尽如人意。为弥补缺陷,有许多更全面的文本量化模型被提出,其中最为直观的是n-grams词包模型(bag-of-n-grams),该模型将n个连续词语组成的词组视作分析单元,并基于词包模型的权重计算方法计算词组权重。第三步,基于量化后的文本训练机器学习分类器,并利用训练好的分类器识别新文本中的情感信息。早期研究中,传统机器学习模型常被用作情感分类器,如林江豪等[11]通过朴素贝叶斯模型实现了微博情感分类。随着深度学习技术崛起,学者发现深度神经网络在情感分类上的表现优于传统模型,如Lai等证实:相比于逻辑回归与支持向量机,递归神经网络、卷积神经网络在文本数据集上的情感分类准确率较高[12]。机器学习法能识别否定、反问等特殊情感表达,准确判断较细颗粒文本的情感,但所需数据量较大,且需耗费人工为文本打情感标签,成本较高。

《情感指数对MOOC学生成绩的预测研究.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:

文档为doc格式

相关热搜

《情感指数对MOOC学生成绩的预测研究.doc》

VIP请直接点击按钮下载本文的Word文档下载到电脑,请使用最新版的WORD和WPS软件打开,如发现文档不全可以联系客服申请处理。

文档下载
VIP免费下载文档

浏览记录