初级汉语听力测试信度研究

  • 投稿小甜
  • 更新时间2015-09-17
  • 阅读量1061次
  • 评分4
  • 86
  • 0

贺雪霏 宋春阳

摘 要:利用spss软件对留学生初级汉语听力试卷进行统计分析,检测其难度、区分度及内在信度,分析该试卷存在的不足,并针对试卷编写提出改进建议。

教育期刊网 http://www.jyqkw.com
关键词 :初级汉语 听力测试 难度 信度

一、引言

听力是第二语言教学双方都十分重视的一项语言技能,也是衡量一个人综合语言能力的一项重要指标。听力测试是语言测试中一个非常重要的部分,一份高质量的试卷可以在最大程度上测试出学生的实际能力。本文对上海交通大学国际教育学院的留学生初级汉语听力测试期末试卷进行分析,主要对试卷的难度和内在信度两个方面进行检验,分析学生听力的薄弱点,希望对试卷编写和听力教学提供一定帮助。

二、测试概况

(一)研究对象

本研究选取了上海交通大学国际教育学院2014年1月,初三汉语听力测试期末试卷作为研究对象,被试是初等三级的汉语学习者,共有148人,实际参加考试的人数共为105人,有效试卷为105份。(二)研究方法

本文通过统计出每道题的答对率,运用SPSS软件,分析试卷的难度、区分度,采用a信度系数法和分半信度法检测试卷的内在信度。

三、试卷分析

(一)试卷结构

该套试卷由50道单项选择题构成,每小题答对得2分,共计100分。试题分为三个部分:第一部分是两个人的一问一答第三个人就对话提一个问题,共15道题;第二部分是两个人的简短对话,第三个人根据对话提一个问题,共20道题;第三部分是几段简短的对话或讲话,每段话后,被试将听到若干个问题,共15道题。所有听力材料都会念两遍。

(二)测试成绩分析

图1为根据此次听力成绩绘制的直方图,由该图可以看出,此次听力测试的整体成绩基本呈正态曲线分布,分数主要集中在40~70之间。表1、2显示,该测试最高分为86,最低分为22,高分与低分差距悬殊,且低分很低。从以上数据还可以看出,及格率较低,为55.2%,且平均分很低,为58.99<60。通常考试的标准差应控制在9~15之间比较恰当。如果标准差小于8,说明成绩分布较为集中,试卷区分度太小,中等难度的题目偏多;标准差如果大于16,则说明成绩过于分散。该测试学生成绩标准差为15.50217>15,说明成绩有一定分化,具有较高区分度。

(三)难度分析

难度是衡量试题难易程度的指数,本文采用考生对试题的答对率作为难度系数,即答对的分数除以总分,难度一般用字母“P”表示,难度系数越小,题目难度越大。一般来说,当P>0.7时,试题太易;当P<0.4时,试题太难;当0.4<P<0.7时,试题为在中等难度。根据统计,本测试P>0.7的简单题目有15道,占全部试题的30%;P<0.4的较难题目有9道,占18%;0.4<=P<=0.7的中等难度题目有26道,占52%,试题易、中、难比例接近于3:5:2,结构较为合理。试卷的整体难度为0.59,说明试卷难易程度适中。

(四)信度分析

信度也叫测试的可靠性,指的是测试结果是否稳定可靠。试卷信度可用信度系数来表示,系数越大,信度越高,试卷可信程度也就越高。信度系数为1,表明研究工具(如试卷)完全可靠;相关系数为0,表明该研究工具完全不可靠。一般认为,小于0.6的试卷,内部一致性低,信度较低;介于0.6和0.8之间的试卷,信度较高;大于0.8的试卷,内部一致性高,信度非常高。

本文首先采用克朗巴赫a系数评价试卷信度,从该套试卷的三个题型之间的相关程度来检测其内在一致性。

表3中,本套试卷的Cronbach´s a值达到0.837,大于0.8,一致性信度很好,测试的可靠性比较高。

表4、表5为项间相关性系数,即三个体型的内在相关一致性。表4中,题型一和题型二之间的相关系数是0.641,与题型三之间的相关系数为0.555,题型二与题型三之间的相关系数是0.713。通过数据可以看出,题型一与题型三之间内部一致性低,题型一与题型二、题型二与题型三之间内部一致性较高,考查内容较为相近,且后者一致性明显高于前两组。表5给出了各项间相关系数的平均值,为0.636,在0.6~0.8的区间内,说明三道大题间整体一致性保持良好,信度可靠。

四、学生答题反馈的问题

该套试卷中,部分题目学生答对率很低,答对人数仅占30%左右,甚至更低。本文将选取其中一些出错率高的试题,分析学生出错的原因,提出试题的改进建议。

(一)干扰信息过多,未能突出关键信息

(26)A:我刚下楼去取了账单,水费56,电费160,话费单300……

B:这个月的话费又这么多。

A:电话费是不是错了?咱们家这个月没打很多长途啊,怎么这么多钱?

B:长途是没打几个,可你一拿起电话就不停地说,电话费还能不往上涨?

问:这个月电话费为什么很多?

A.错了 B.打了长途 C.打得次数太多 D.聊得很久

(43)……我想,坐地铁肯定来不及,因为走到地铁站还要15分钟,在地铁上差不多也要10分钟,下了地铁还要走5分钟。我想,干脆打个车吧。等了5分钟左右,来了一辆。我告诉师傅地址,还告诉他开快点儿。他说“好嘞!”还好路上没等很多红绿灯。我10分钟以后就到了教学楼……

问:从他家到教学楼坐地铁要多长时间?

A.15分钟 B.20分钟  C.25分钟  D.30分钟

以上两题学生答对率都仅为10.48%。第26题中,出现多个在现实生活中可能引起电话费贵的因素,如“出错、打长途次数多、通话时间长”,且选项中的答案客观上似乎合乎常理,学生只能通过对所听语料进行仔细甄别,排除干扰信息,提取正确信息。但这里的干扰信息过多,而且关键信息的词汇等级也较高,如“不停地”“聊”,所以造成答对率过低。而在第43题中,在这个语段中出现了多个时间点,学生易产生混淆,并且此题还涉及数字运算,选择正确的信息进行相加,进一步增加试题的难度。

(二)词汇或句式过难,超出了学生的理解能力

(40)……

B:好的,租金怎么付?

A:付三押一。一个月租金是5000。

……

问:要租这套房子,第一次应该付多少钱?

A.5000 B.1000 C.15000 D.20000

(4)A:我父母都希望这次比赛我能得冠军,看来要让他们失望了。

B:你最近都没怎么训练,不过只要从现在起努力,得冠军也不是不可能的。

问:第二个人认为能得冠军吗?

A.能 B.不能 C.可能 D.不可能

以上两题,学生答对率分别为21.9%和33.33%。第40题中,教育期刊网 http://www.jyqkw.com
关键词 是“付三押一”,该词难度大,意思是“付三个月房租和另付一个月作为押金”,“付”不难理解,但“押”学生不容易理解,且这种省略紧缩形式,即使学生听对读音,也不清楚词的意思。第4题中,学生出错的原因是没有掌握“双重否定”这一表达“肯定”的语法结构,“不是不可能”意思是“有可能”,但绝大多数学生将其理解为“不可能”,造成错误。

五、结语

通过分析,整套试卷质量较好,区分度高,将不同水平的学生能力测试了出来。在题目的难易程度安排上,结构合理,内部一致性高,信度很好,测试结果具有稳定性,但各题型之间的内在一致性仍需提高。该试卷设计比较理想,但其中有些词汇超出学生现阶段接受能力,对听力材料的选择可以更加完善。这次考试反映出学生能力差异过大,教师应当平衡学生整体素质,以免差距继续拉大。对能力差的同学应采取有效的补救措施,因材施教,针对弱点,教授听力技巧,帮助其提高听力。此外,通过学生答题情况分析,学生排除干扰、跳跃障碍的能力较弱,对关键信息的处理能力有待提高。听力虽然属于一项语言技巧,但需要系统扎实的语言知识作为支撑。掌握词义和语法知识对听力有着重要意义,因此教师不可忽视对语言知识的讲解。

教育期刊网 http://www.jyqkw.com
参考文献

[1]柴省三.汉语水平考试(HSK)听力测验构想效度研究[J].语言文字应用,2011,(1).

[2]谷陵.论汉语听力测试中应考查的六种听力技能[J].云南师范大学学报(对外汉语教学与研究版),2003,(6).

[3]金琰如,王佶旻.初级阶段留学生汉语听力能力结构探究[J].语言教学与研究,2012,(3).

[4]李慧.汉语作为第二语言的测试研究[M].北京:北京语言大学出版社,2011.

[5]杨瑞和.语言研究应用SPSS软件实例大全[M].北京:中国社会科学出版社,2004.

[6]赵金铭.语言测试理论及汉语测试研究[M].北京:商务印书馆,2006.

[7]朱正才,范开泰.语言听力理解能力的认知结构与测试[J].语言教学与研究,2001,(3).

(贺雪霏 宋春阳 上海交通大学国际教育学院 200030)