数理统计的方法在试卷质量分析中的应用

  • 投稿云界
  • 更新时间2015-10-21
  • 阅读量518次
  • 评分4
  • 55
  • 0

董媛媛

陨阳师范高等专科学校数学与财经系 湖北十堰 442000[摘要]本文主要应用数理统计方法,通过探讨试卷的难度、区分度、信度和覆盖度等质量指标对我校2006级文科数学考试试卷质量进行了定量分析,该方法简单易行,为高校教师提供了一种有效的试卷分析方法。

[教育期刊网 http://www.jyqkw.com
关键词 ]数理统计;数学试卷;质量分析

Appl ication of Mathematical statistic s method in the paper’s quality analysis

DONG Yuan-yuan,

(Department of Maths and Finance, Yunyang Teachers’College, Shiyan 442000, Hubei)

Abstract:In this paper,the quality of Our school level 2006 liberal arts mathematics examination paper has been carried on the quantitative analysis by discussing the difficulty of the examination paper, degree of differentiation, the reliability and coverage quality indexes, this method is simple, for college teachers is an effective method of examination paper analysis.

Key words:Mathematical Statistics;Mathematical Examination Paper;Quality Analysis

1、试卷的质量指标及其关系

根据教育测量学【1】,评价试卷质量的指标主要有效度、难度、信度、区分度和覆盖度,一份好的试卷应是难度适中,区分度较大,能分辨出学生的学习状况,并且具有较高的信度和覆盖度。

难度是衡量试卷各题难易程度的质量指标,是反映试卷与学生知识水平适合度的一个量“即指一次考试中未答对某道试题的考生数在其总体中所占的比例,显然试卷各题的难度可以用该题的平均失分和该题满分之比来度量”即如果用Di表示第i题的难度,Wi表示第i题的满分值,Xi表示被测对象第i题的平均得分,则用公式来表示试卷的难度,难度最大为1,最小为0。试卷的命题过难过偏,会造成考生成绩过低;命题过易,没有达到教学大纲所规定的目标,会使考生很容易得高分,不但不能区别学生学习的优劣,而且也不能暴露出教学上的问题所在.因此合理的难度分配是一套高质量试题的重要方面,全套平均难度应控制在0.5附近,一般难,中,易的比例应为20,60,20.把握适当的试题难度很重要.试题的难度直接影响考试成绩的分布形态和离散度,如试题过难优秀生和差生均不会回答,考试成绩偏低,呈正偏态分布;反之,试题过易优秀生和差生均会回答,考试成绩偏高,呈负偏态分布。

信度是试卷质量中的重要指标,信度指的是测量结果的稳定性或可靠性的程度,亦即测量的结果是否真实、客观地反映了考生的实际水平;我们把一份试卷对同一对象前后测试结果的相关程度称为试卷的信度,信度可以用前后测试结果的相关系数来度量.在此我们利用系数法来求解试卷的信度,用克朗巴赫系数计算公式:,其中δi2为第i题的测试方差【2】,δ2为试卷测试的方差,n为试卷题目的个数.试卷的信度最大值为1,最小值为-1.显然一份质量好的试卷,应具有较高的信度.考试的信度要求校内自行考试一般不低于0.60,标准化考试要求≥0.90。区分度是衡量试卷各题在区别测试对象不同水平程度上的指标,它反映试题对考生水平的鉴别能力,该值可用于衡量每一试题在多大程度上能测出整个考试所要衡量的知识、技术或能力。如果每道题学习好的同学得分高,学习差的同学得分低,说明该试题的区分度高;反之,如果每道题学习好的同学和学习差的同学得分差不多,则区分度低.如果难题学习好的不会做,而学习差的会做,则为偏题、怪题,这时区分度为负值.计算区分度的方法有很多种,现在我采用一种高低27%分组法来求.具体计算如下:根据学生第i题成绩优劣排列顺序,我们把第i题的成绩最高的27%学生和第i题成绩最差的27%学生分别划分到高分组和低分组,排列分组后;令其中Qi为i题区分度;Hi表示高分组学生在第i题得分的平均分;Li表示低分组学生在第i题得分的平均分;M1第i题规定满分;M2表示第i题规定满分.区分度指数的范围在-1至1之间,根据艾伯尔提出的评价标准:Qi≥0.4,说明质量非常好;0.30≤Qi≤0.39,说明质量良好;0.20≤Qi≤0.29,说明质量尚可,但仍需修改;Qi≤0.20说明质量差,必须淘汰。

试卷的覆盖度【3】是基于试卷的覆盖面程度,根据教育学的观点,学生能力的差异主要反映在知识面和知识的积累上,试题质量的四个指标与试题的覆盖面有密切关系,覆盖面大,指标的性能较好,覆盖面小,指标的性能较差。通常用各题目之间的相关系数矩阵Rij表示覆盖面的大小;其中,xki表示第k个学生第i题的得分,si表示第i题的得分的均方差,表示考生在第i题上所得的分数平均值,N表示考生数.试卷的覆盖面越广,则各题之间的交叉相关性就越小,反之,则越大.相关系数矩阵的实质就是反映试题的覆盖面大小的,通常以Rij<0.2为覆盖面大,覆盖面大试卷有效性就高.一份好的试卷其试题的选择一定要有覆盖面,对课程的主要内容一定要覆盖到,这样的抽样才具有代表性。

2、对2006级文科数学试卷的分析

运用计算机程序计算所得覆盖度系数矩阵为:

有上述计算结果,我们可以得出如下结论:(1)由本次考试试卷的各项系数中的难度一栏可以看出难度>0.3的只有第1题和第7题其为选择题和计算题,而难度在0.1~0.3难度的试题为7道,本份试卷中等难度的题为两道1和7题,其余的均为简单题.基本上本份试卷为比较容易的没有多大难度,希望出题教师在以后的出题上能够稍微提高试题难度.(2)由区分度来看:根据艾伯尔提出的评价标准来分析:3、4、5、7、8、10题的区分度都>0.40,说明这些试题的质量很好,1、2、6题的区分度处于0.30-0.39之间说明这三道试题的质量比较好.第9题的区分度处于0.20-0.29之间说明此道试题的质量尚可,但是需要进行修改. 总体上各题的区分度介于0-1之间没有出现负值.虽然在同一份试卷内各题的区分度有明显的差距,但总体上还是合理的,基本能区分学生水平.(3)由信度来看本套试题的信度明显较低,但考试的信度也受多种因素的影响:首先本套试题难度较低,再者考场纪律的松紧、学生的态度,以及考试本身的重要程度多方因素造成了本次考试信度较低的结果.所以这样的结果在所难免.(4)由覆盖度来看Rij<0.2的占九成说明此份试题的覆盖面大,对学生所学知识考察也是很全面的。

综上分析可以得出:此份试题除了难度较低导致信度较差以外总的来说还是很可以的,试题有效性还是很好的.但是如果要将本份试题加入试题库,那么就需要对本份的难度进行提高.才能使本份试卷的有效度更好,质量更高,能够更全面、系统、真实的反映学生的学习效果。

教育期刊网 http://www.jyqkw.com
参考文献

[1]郭述平,王景英.教育测量[M].长春:东北师范大学出版社,1987

[2]熊德云,张东军.概率论与数理统计及其应用[M].科学出版社,2005.

[ 3 ] 马少仙.试卷质量的统计分析方法[ J ] .西安民族学院学报,2001.22(4):13-16.

基金项目

陨阳师专校级项目(2012B08)

作者简介

董媛媛(1983—),女,湖北孝感人,讲师,硕士,主要从事最优化理论研究。