中国人文社会科学核心期刊

中文社会科学引文索引(CSSCI)来源期刊

中文核心期刊

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

高考数学中考试评价的研究——基于CTT与IRT的实证比较

闫成海 杜文久 宋乃庆 张健

闫成海, 杜文久, 宋乃庆, 张健. 高考数学中考试评价的研究——基于CTT与IRT的实证比较[J]. 华东师范大学学报(教育科学版), 2014, 32(3): 10-18.
引用本文: 闫成海, 杜文久, 宋乃庆, 张健. 高考数学中考试评价的研究——基于CTT与IRT的实证比较[J]. 华东师范大学学报(教育科学版), 2014, 32(3): 10-18.
YAN Chenghai, DU Wenjiu, SONG Naiqing, ZHANG Jian. Evaluation of Examination in Math in College Entrance Examination: A Empirical Comparative Study on CTT and IRT[J]. Journal of East China Normal University (Educational Sciences), 2014, 32(3): 10-18.
Citation: YAN Chenghai, DU Wenjiu, SONG Naiqing, ZHANG Jian. Evaluation of Examination in Math in College Entrance Examination: A Empirical Comparative Study on CTT and IRT[J]. Journal of East China Normal University (Educational Sciences), 2014, 32(3): 10-18.

高考数学中考试评价的研究——基于CTT与IRT的实证比较

基金项目: 

教育部哲学社会科学研究后期资助项目"中国基础教育改革与发展研究" 11JHQ001

重庆市教育科学规划项目"项目反应理论在普通高考中的应用" 2011 KS035

  • 丁树良、罗芬等:《项目反应理论新进展专题研究》,北京:北京师范大学出版社, 2012年第109页。
  • 杜文久:《高等项目反应理论》,重庆:西南师大出版社,2007年第71-88页。
  • 杜文久:《高等项目反应理论》,重庆:西南师大出版社,2007年第153-156页。
  • 沈南山:《基于IRT模型的数学学业成就水平测试分析》,《安徽师范大学学报》(社科版)2012年第1期。
  • Lord,F.M.Applications of item response theory to practical testing problems. Hillsdale, NJ: Lawrence Erlbaum Associates, 1980.
  • 王晓华、文剑冰:《项目反应理论在教育考试命题质量评价中的应用》,《教育科学》2010年第3期。
  • 朱德全、宋乃庆:《教育统计与测评技术》,重庆:西南师大出版社,2008年第67页。
  • 赵守盈、石艳梅等:《项目反应理论在大规模选拔性考试试题质量评价中的应用》,《教育学报》2013年第1期。
  • Hambleton, R.K. Swaminathan,H.Item Response Theory:Principles and Applications.Kluwer-Nijhoff Publishing, 1985.
  • 陈谨、何静等:《英语标准化考试评价中IRT与CTT的比较研究》,《数学的实践与认识》2011年第20期。
  • 何穗、吴慧萍:《基于教育测量理论的中学数学试卷质量评价研究》,《教育测量与评价》(理论版)2012年第8期。

Evaluation of Examination in Math in College Entrance Examination: A Empirical Comparative Study on CTT and IRT

  • 摘要: 相关研究表明,IRT在教育考试评价中比CTT具有诸多优点。本文以某地区高考数学考试数据为基础,比较CTT与IRT在项目参数、评价方式、精度估计三个方面之间的差异。研究结果证明,在IRT下参数更容易反映观测各个项目的特征属性,IRT参数比CTT参数更具精确性,项目信息函数能更好的反映试题信息;CTT与IRT的评价方式不同,IRT下的能力分数优于CTT下的测验分数,更能反映学生能力水平;CTT与IRT精度估计不同,IRT测验信息函数和能力置信区间比CTT有更好的精度。实证展示出IRT在高考数学考试评价中的优越性,具有重要的价值和应用前景。
    1)  丁树良、罗芬等:《项目反应理论新进展专题研究》,北京:北京师范大学出版社, 2012年第109页。
    2)  杜文久:《高等项目反应理论》,重庆:西南师大出版社,2007年第71-88页。
    3)  杜文久:《高等项目反应理论》,重庆:西南师大出版社,2007年第153-156页。
    4)  沈南山:《基于IRT模型的数学学业成就水平测试分析》,《安徽师范大学学报》(社科版)2012年第1期。
    5)  Lord,F.M.Applications of item response theory to practical testing problems. Hillsdale, NJ: Lawrence Erlbaum Associates, 1980.
    6)  王晓华、文剑冰:《项目反应理论在教育考试命题质量评价中的应用》,《教育科学》2010年第3期。
    7)  朱德全、宋乃庆:《教育统计与测评技术》,重庆:西南师大出版社,2008年第67页。
    8)  赵守盈、石艳梅等:《项目反应理论在大规模选拔性考试试题质量评价中的应用》,《教育学报》2013年第1期。
    9)  Hambleton, R.K. Swaminathan,H.Item Response Theory:Principles and Applications.Kluwer-Nijhoff Publishing, 1985.
    10)  陈谨、何静等:《英语标准化考试评价中IRT与CTT的比较研究》,《数学的实践与认识》2011年第20期。
    11)  何穗、吴慧萍:《基于教育测量理论的中学数学试卷质量评价研究》,《教育测量与评价》(理论版)2012年第8期。
  • 图  1  CTT与IRT难度参数对比图

    图  2  CTT与IRT区分度参数对比图

    图  3  第11题项目信息函数

    图  4  第11题项目特征曲线

    图  5  第12题项目信息函数

    图  6  第12题项目特征曲线

    图  7  测验分数分布

    图  8  能力分数分布

    图  9  测验信息函数

    图  10  能力分数置信区间

    表  1  IRT与CTT项目指标分布图

    项目abc难度区分度
    1(1)0.18-9.900.250.940.42
    2(1)1.30-1.220.250.890.52
    3(1)1.48-1.380.250.920.52
    4(1)1.43-1.110.250.890.54
    5(1)1.27-1.260.250.900.52
    6(1)1.70-0.820.250.860.58
    7(1)0.95-0.050.250.650.44
    8(1)1.700.030.250.660.50
    9(1)2.660.770.250.380.40
    10(1)2.010.970.250.390.24
    11(1)1.28-1.640.000.920.52
    12(1)1.750.030.000.540.62
    13(1)1.290.070.000.510.55
    14(1)1.540.720.000.250.46
    15(1)1.181.610.000.080.27
    16(1)3.51-0.740.000.680.80
    16(2)2.37-0.380.000.680.80
    16(3)1.88-0.120.000.680.80
    16(4)1.520.450.000.680.80
    17(1)1.77-0.680.000.740.74
    17(2)1.56-0.210.000.740.74
    17(3)1.43-0.070.000.740.74
    18(1)2.40-0.720.000.630.80
    18(2)2.17-0.530.000.630.80
    18(3)2.16-0.410.000.630.80
    18(4)1.790.580.000.630.80
    18(5)1.461.050.000.630.80
    19(1)1.56-1.000.000.560.75
    19(2)2.050.200.000.560.75
    19(3)2.440.520.000.560.75
    19(4)2.160.670.000.560.75
    20(1)1.92-0.170.000.420.75
    20(2)1.82-0.020.000.420.75
    20(3)2.710.500.000.420.75
    20(4)3.550.950.000.420.75
    21(1)1.92-0.070.000.220.68
    21(2)1.970.430.000.220.68
    21(3)111.30288.830.000.220.68
    21(4)111.14318.490.000.220.68
    21(5)111.01320.200.000.220.68
    说明:平均分:90,标准差:31.69,信度rx:0.84,测验标准误:12.52
    下载: 导出CSV

    表  2  难度与区分度参数分布表

    难度区、分度分布范围0~0.300.30~0.700.7~1.00
    难度题数3108
    区分度题数2154
    平均分标准差信度测验标准误
    9031.690.8412.52
    下载: 导出CSV

    表  3  项目难度与区分度参数分布

    难度b-2以下-2~22以上
    题数1363
    区分度a0.5以下0.5~22以上
    题数12415
    下载: 导出CSV
  • 加载中
图(10) / 表(3)
计量
  • 文章访问数:  214
  • HTML全文浏览量:  171
  • PDF下载量:  1
  • 被引次数: 0
出版历程
  • 刊出日期:  2014-09-20

目录

    /

    返回文章
    返回