12现代教育测量与评价

2024-10-12

12现代教育测量与评价(共8篇)

1.12现代教育测量与评价 篇一

2005年上半年高等教育自学考试福建省统一命题考试现代教育测量与评价学 试卷6231

一、单项选择题(本大题共20小题,每小题1分,共20分)在每小题列出的四个备选项中有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均无分。1.用公式形象表述:“评价=测量(定量描述)+非测量(定性描述)+价值判断”的人是 【 】 A.格兰朗德 B.斯塔费尔比姆 C.泰勒 D.德雷斯 2.在教学过程中经常实施的,在性质上相当于现在的中小学单元测验,我们称之为【 】 A.形成性测量与评价 B.诊断性测量与评价 C.终结性测量与评价 D.安置性测量与评价 3.在编制客观性试题时,题干要尽可能地采用 【 】 A.疑问陈述 B.正面陈述 C.否定陈述 D.似真性陈述 4.解释测验分数的参照系为 【 】 A.标准 B.常模 C.目标 D.等级 5.包含和目标相适应的一组题目构成的测验称为 【 】 A.领域参照测验 B.目标参照测验 C.掌握测验 D.标准参照测验 6.以考试分数作为追求的目标和决策的依据,把学生丰富多彩的个性和学习历程用笼统的 分数表达,这种分数我们称之为 【 】 A.表征性分数 B.实质性分数 C.掌握性分数 D.认知性分数 7.在原有的感性认识基础上,经过重新组合等加工改造而创造出新形象的活动,我们称之 为 【 】A.记忆 B.观察 C.思维 D.想象 8.具有量的大小和相等单位外,还具有绝对零点的量表称为 【 】 A.称名量表 B.顺序量表 C.等距量表 D.比率量表 9.科举考试制度始于 【 】A.春秋战国时期 B.两汉时期C.魏晋南北朝时期D.隋朝 10.测量与评价的指导思想是 【 】A.选拔适合精英教育的学生B.创造适合学生发展的教育 C.对学生的学业进行精确的评定 D.改变教育的内外环境 11.效度始终是针对一定的【 】A测量目的而言 B测量手段而言 C测量过程而言 D测量方法而言 12.美国教育测验中心举办的“托福”考试线性变换分数是 【 】 A.500+100Z B.90+20T C.500+70Z D.100+15Z 13.标准参照测验的定量标准是【 】 A合格分数线 B掌握分数线 C标准分数线 D等级分数线 14.以下哪一项不是绝对评价等级制常见的方法 【 】 A.教师综合评价法B.测量结果转换法 C.核心内容参照法D.最佳行为评价法 15.以下哪一项不是思维能力的测量与评价的方法 【 】 A.语言文字推理测验 B.图形 C.作品分析D.数字符号 16.个人把自己的思想、态度、愿望、情绪和性格等特征,不自觉地反应于外界或他人的一种心理过程,我们称这种方法为 【 】 A.自陈量表法 B.投射测验法 C.情境测验法 D.逆境对话法 17.在学生真实的生活情境中,通过控制无关变量,操纵某些自变量,激发学生内心矛盾冲 突,从而测评学生的品德行为、品德动机、品德情感体验及认识评价的方法是 【 】 A.品德情境模拟测评B.品德现场情境测评 C.品德情境积分测评 D.品德现场评语测评 18.学生身体领域发展目标,本质上是【 】 A.身体发育、增强体质 B.身体素质、身体形态 C.身体发育、身体形态 D.身体发育、身体素质 19.由测验专家严格按照测验程序而编制成的测验称为 【 】 A.标准化测验 B.非标准化测验 C.成就测验 D.能力倾向测验 20.情感领域教育目标的最高境界是 【 】 A.接受 B.反应 C.价值评价 D.价值复合体形成的性格化

二、填空题(本大题共20小题,每空1分,共20分)请在每小题的空格中填上正确答案。21.教育评价是在获得足够多的资料事实的基础上,作出。22.斯塔费尔比姆认为,评价最重要的意图不是为了,而是为了改进。23.按测验的材料可分为文字测验和。24.整个测验的难度系数在 左右时,可使测验对被试有较大的鉴别力。25.主观性试题主要适合于测量 的教学目标。26.筛选评价指标的方法有经验法、调查统计法和。27.教育调查依据目的可以分为常模调查和 两类。28.任何一批原始分数,转化成Z分数后,这批Z分数的平均值为。29.标准参照测验的定性标准是。30.学生课业发展的内容框架可以从个体一般发展目标,学科性发展目标和 三个层面来界定。31.考试只是评价过程所运用的 而已。32.思维能力的测验与评价方法有语言文字推理测验,图形和。33.能力倾向测验主要有学习能力倾向测验和。34.具有一定倾向性的心理特征的总和称为。35.“三环结构说”的核心是。36.体育锻炼的主要项目有身体素质锻炼和。37.建立评价学生全面发展的指标体系主要包括 和一般发展目标。38.比率量表的零点是。39.为满足教育测验的需要,布卢姆等人将教育目标分为认知、情感和 三个领域。40.区分度的分析方法大约可以归纳为两类:一为外部效标法;二为。

三、名词解释题(本大题共2小题,每小题3分,共6分)41.教育测量 42.掌握测验

四、简答题(本大题共5小题,每小题6分,共30分)43.教育测量与教育评价的区别与联系。44.改进教师教学的功能是什么? 45.创新的概念及内涵分析。46.体育情感领域发展目标。47.发展性评价的基本内涵。五.论述题(本大题共2小题,第48小题10分第49小题14分,共24分)48.试述多元智能理论的观点。49.联系实际谈谈你是如何理解发展性教师评价?

2006年4月高等教育自学考试福建省统一命题考试 现代教育测量与评价学

一、单项选择题(本大题共19小题,每小题1分,共19分)1.五分制是一种 【 】A.称名量表 B.顺序量表 C.等距量表 D.比率量表 2.我国教师进入转型期,国际教师专业发展的必然趋势是 【 】 A.师范教育 B.教师教育 C.终身教育 D.继续教育

3.由测验专家严格按照测验程序而编成的一种测验称为 【 】 A.标准化测验 B.非标准化测验 C.成就测验 D.能力倾向测验

4.在编制配合题时,相对于选项而言,每一试题的配对数目不超过 【 】 A.5个 B.7个 C.10个 D.

12、个

5.当原始分数比平均数高时,其相应的标准分数为 【 】 A.正值 B.负值 C.0 D.1 6.建立在一套完善的题目汇编或内容领域规范汇编基础上的用于检查被试素质及发展水

平的测验,我们称之为 【 】 A.领域参照测验 B.目标参照测验 C.掌握测验 D.标准参照测验

7.采用多元的方法对学生的课业发展进行评估.重视过程与结果的评估方法是【 】 A.表征性考评机制 B.实质性考评机制 C.掌握性考评机制 D.发展性考评机制

8.一种有目的、有计划、持久的知觉活动我们称之为 【 】 A.记忆 B.观察 C.思维 D.想象

9.采用内省报告、观察评判为基本方式,以语言文字转达评定结果的方法称为【 】 A.操行评语法 B.操行加减评分法 C.考试考核测评法 D.积分测评法

10.教育评价是以教育目标为标准的 【 】 A.事实半口断 B.价值判断 C.过程判断 D.数据判断

11.物理量的测量大多是直接性的,丽教育测量内容主要是关于人的种种非物质属性,只能 通过人对来自外界的刺激作出___的测量。【 】 A.间接性、推断性 B.模糊性、不确定性 C.间接性、多样性 D.多样性、抽象性

12.我国的考试制度的建立是在 【 】 A.西周 B.两汉时期 C.魏晋南北朝 D.隋朝

13.对经常表现出学习困难的学生所做的测量与评价,我们称之为 【 】 A.形成性测量与评价 B.诊断性测量与评价 C.终结性测量与D.潜力参照测量与评价 14表示每项评价指标在指标体系中所古的重要性程度,并赋予相应的值,这个数值叫【 】

A.评价指标 B.评价权重 C.评价标准 D.评价目标

15.以下哪项不是美国耶鲁大学斯腾伯格教授提出的成功智力理论所包括的内容【 】 A.分析性 B.创造性 C.操作性 D.实践性

16.以下哪一项不是人格评价的内容 【 】 A.气质 B.性格 C.适应性 D.交际

17.课堂作业观察评估法是属于 【 】 A.思维分析评价法 B.作品分析评价法 C.心理分析评价法 D.想象分析评价法 18.假如某学生在期中语文统考中卷面分数为75分,又知该学生所在年级中有80%的学生成绩低于75分,我们可以表达该生的 【 】

A.标准分为80 B.原始分为80 C.百分等级为80 D.常模分为80 19.教师依据教学目标与计划,请学生持续一段时间主动收集、组织与省思学习成果档案,以评定其努力、进步、成长情形的评价方法是 【 】 A.档案袋评价 B.动态评价 C.轶事记录评价 D.同伴评价

二、填空题(本大题共20小题,每小题1分,共20分)20.测量的三个基本要索是测量的量具、测量的单位和测量的______。21.测量与评价的指导思想是为了______的教育环境。

22.评分者信度指的是多个评分者给同一批人的答卷进行评分的______。23.知识、领会、应用、分析、综合、评价是布卢姆______目标的分类。24.评价标准是由强度和频率、标号、______三个要素构成。25.发展常模可以分为年级常模和______两类。26.标准参照测验的定量标准是______。

27.同伴评定的两种常见方法是人物推定法和______。

28.托兰斯创造思维测验分为甲、乙两式,甲为图形思维创造测验,乙为______。29.人格心理测量与评价的方法有自陈量表法和______。

30.道德心理学家的研究表明,道德的形成与发展有一个他律到自律,再由______的过程。

31.学生身体领域发展目标,本质上是学生的身体发育和______。32.建立评价学生全面发展的指标体系主要包括学科学习目标和______。33.斯塔费尔比姆认为,评价最重要的意图不是为了证明,而是为了______。34.填空题的空白处所填写的应该是______。35.等距量表的零点是______。

36.教育测量与评价在行使行政教育管理的功能中,对教师的管理具体体现在教师资格评

定,教师教学艺术水平的界定,教师管理水平的界定和教师______的界定。37.效标关联效度可分为同时效度和______。

38.基于测验题目的双基度指标下的经验评判法,题目的双基度可在______之间取值。

39.题目区分度就是题目区别______。

三、名词解释题(本大题共2小题,每小题3分,共6分)40.效度 41.课程目标参照

四、简答题(本大题共5小题,每小题6分,共30分)42.教育评价包含的几个共同的要点是什么?

43.一份高质量的测验蓝图所具有的两个最基本的作用是什么? 43.一份高质量的测验蓝图所具有的两个最基本的作用是什么? 44.测验内容领域规范的四个目的是什么? 45.操行评语法的优点与建议。

46.《中小学评价与考试制度改革》文件的主要精神是什么?

五、论述题(本大题共2小题,第47小题11分,第48小题14分,共30分)47.如何理解教育改革呼唤教育测量与评价更加科学化? 48.结合教学实际,论述新课程评价改革的重点

2007年4月高等教育自学考试福建省统一命题考试

现代教育测量与评价学

一、单项选择题(本大题共20小题,每小题1分.共20分 1.测量必须具备三个基本条件,以下哪一项不是()A量具B单位C标准D.参照点 .2.测量与评价的指导思想是为了()A.选拔适合精英教育的学生B.创造适合学生发展的教育环境C.对教育对象进行价值判断D.对学生进行分等级排名次 3.国际教师教育发展的必然趋势是()A.师范教育B.教师专业化C.终身教育D.继续教育

4.对经常表现出学习困难的学生,多半在形成性测量与评价之后实施的是()A.终结性测量与评价B.诊断性测量与评价C.常模参照测量与评价D.标准参照测量与评价

5. 以下哪一项不是信度估计的方法()A.重侧信度B.复本信度C.同质性信度D.标准信度

6.整个测验的难度系数在多少时,可使测验对被试有较大的鉴别力()A.0.3B.0.5C.0.7D.0.9 7.将抽象的概念用于特定的和具体的情境是认知领域目标的哪个类别()A.知识B.领会C.运用D.评价

8.年龄常模是属于()A.发展常模B.组内常模C.百分等级常模D.标准分数常模

9. 以下哪一项不属于标准参考测验分数解释的范围()A.正确百分数B.掌握分数C.百分等级分数D.内容等级分数

10.重视用多元的方法对学生的课业发展进行评估,重视过程与结果的评估方法是()A.表征性考评机制B.实质性考评机制C.掌握性考评机制D.发展性考评机制 11.测量学生一般的学习能力和潜能,即是否具备较好的学习和研究的潜在能力的为()A.学习能力倾向测验B.职业能力倾向测验C.创造能力倾向测验D多元治理倾向测验 12.养成性品德测评法又称为()A.品德情境测评法B.OSL品德测评法C.FRC品德测评法D.积分测评法

13.以作品、表演、展示、操作等方式真实地表现学生学习的成果与过程的测验是()A.课程目标参照法B.专题内容领域参照法C.表现性测验评价法D.评定量表测评法 14.以下哪一项不属于作品分析评价法()A.拼图法B.作图法C.完成法D.课堂作业观察评估法 15.多元智力理论是由谁提出来的()A.加德纳B.斯滕伯格C.卡特尔D.吉尔福特

16.品德语言描述模拟测评和品德图像模拟测评是属于()A.操行平语法B.操行加减评分法C.品德情境模拟测评D.品德现场情境测评 17.一种有目的、有计划、持久的知觉活动我们称之为()A.记忆B.观察C.思维D.想象

18.情感领域教育目标的最低阶段是()A.价值评价B.接受C.反应D.价值复合体形成的性格化 19.填空题的空白处所填写的应该是()A.关键的词语B.识记的内容C.再认的内容D.想象的词语 20.由测验专家严格按照测验编制程序而编成的一种测验称为()A.标准化测验B.非标准化测验C.成就测验D.能力倾向测验

二、填空题(本大题共20小题.每空1分。共20分)21.心理学家史蒂文斯根据测量的精确程度,把量表从低级到高级分成称名量表、顺序量表、____________和比率量表。

22.教育测量是一种以量化为主要特征的____________。

23.人们把“凡存在的东西必有其数量,凡有数量的东西都可以测量”这两句话看成是构成测量和量化评价的____________。

24.教育测量与评价在形势教育管理的功能中,对教师的管理具体体现在:教师资格的评定;____________;教师管理水平的测定;教师的个性评定。25.题目区分度就是题目区别____________。26.测验题目基本上分选择型和____________。

27.常见的简答题有简释题、直接问答题、列举题和____________。

28.我国在具体学科研究中,把教育目标定位识记、了解、简单应用、综合应用、____________五个层面。

29.测验的常模可以分为____________和组内常模两类。

30.标准一词的含义,从定量的方面看,需要确定一个____________作为分类决策的依据。

31.汉布莱顿模式把内容领域范围分成四个部分:说明、____________、内容范围、答案范围。

32.用于班机学生评价的档案袋基本上可以分为成果型档案袋、过程型档案袋、____________三类。

33.所谓发展性评价观,在本职上是秉承一种以人为本,以学生为中心,以____________为基础,以促进学生全面发展为根本宗旨的现代教育评价理念及方法体系。

34.多元智力评估指标及方法有学生行为日记,智力技巧游戏,智力焦点和____________。

35.人格测量与评价的方法有____________和投射测验法。

36.“四项意识说”是从社会实践活动的范围和顺序上来考查人的思想品德,是由政治观、世界观、人生观、____________四个意识因素构成。

37.品德测评的主要功能有描述评定、发展差异、反馈、教育、____________。

38.学生身体领域的发展可以包括身体发育水平、身体素质、身体形态、____________等。

39.本次课改的重点之一,就是让学生的学习产生实质性的变化,提倡自主、探究和合作的学习方式,逐步改变教师中心、课堂中心、学生中心的局面,促进学生____________的发展。

40.知识、领会、应用、分析、综合、评价是布卢姆____________目标的分类。

三、名词解释题(本大题共2小题,每小题3分,共6分)41.信度42.掌握测验

四、简答题(本大题共5小题,每小题6分,共30分)43.简述教育评价包含的共同的要点。44.教育评价指标与目标的关系。45.简述测验内容领域规范的四个目的。46.何谓课程目标参照? 47.体育认知领域发展目标。

五、论述题(本大题2小题,第48题10分,第49题14分,共24分)48.请论述您对发展性教师评价的理解。

49.请论述国外课业考评的主要经验及其对我们今天的课程改革的启示。

2006年4月高等教育自学考试福建省统一命题考试 现代教育测量与评价学

一、单项选择题(本大题共19小题,每小题1分,共19分)1.五分制是一种 【 】A.称名量表 B.顺序量表 C.等距量表 D.比率量表 2.我国教师进入转型期,国际教师专业发展的必然趋势是 【 】 A.师范教育 B.教师教育 C.终身教育 D.继续教育 3.由测验专家严格按照测验程序而编成的一种测验称为 【 】 A.标准化测验 B.非标准化测验 C.成就测验 D.能力倾向测验

4.在编制配合题时,相对于选项而言,每一试题的配对数目不超过 【 】 A.5个 B.7个 C.10个 D.

12、个

5.当原始分数比平均数高时,其相应的标准分数为 【 】 A.正值 B.负值 C.0 D.1 6.建立在一套完善的题目汇编或内容领域规范汇编基础上的用于检查被试素质及发展水

平的测验,我们称之为 【 】 A.领域参照测验 B.目标参照测验 C.掌握测验 D.标准参照测验

7.采用多元的方法对学生的课业发展进行评估.重视过程与结果的评估方法是【 】 A.表征性考评机制 B.实质性考评机制 C.掌握性考评机制 D.发展性考评机制

8.一种有目的、有计划、持久的知觉活动我们称之为 【 】 A.记忆 B.观察 C.思维 D.想象

9.采用内省报告、观察评判为基本方式,以语言文字转达评定结果的方法称为【 】 A.操行评语法 B.操行加减评分法 C.考试考核测评法 D.积分测评法

10.教育评价是以教育目标为标准的 【 】 A.事实半口断 B.价值判断 C.过程判断 D.数据判断

11.物理量的测量大多是直接性的,丽教育测量内容主要是关于人的种种非物质属性,只能 通过人对来自外界的刺激作出___的测量。【 】 A.间接性、推断性 B.模糊性、不确定性 C.间接性、多样性 D.多样性、抽象性

12.我国的考试制度的建立是在 【 】 A.西周 B.两汉时期 C.魏晋南北朝 D.隋朝

13.对经常表现出学习困难的学生所做的测量与评价,我们称之为 【 】 A.形成性测量与评价 B.诊断性测量与评价 C.终结性测量与D.潜力参照测量与评价 14表示每项评价指标在指标体系中所古的重要性程度,并赋予相应的值,这个数值叫【 】

A.评价指标 B.评价权重 C.评价标准 D.评价目标

15.以下哪项不是美国耶鲁大学斯腾伯格教授提出的成功智力理论所包括的内容【 】 A.分析性 B.创造性 C.操作性 D.实践性

16.以下哪一项不是人格评价的内容 【 】 A.气质 B.性格 C.适应性 D.交际

17.课堂作业观察评估法是属于 【 】 A.思维分析评价法 B.作品分析评价法 C.心理分析评价法 D.想象分析评价法

18.假如某学生在期中语文统考中卷面分数为75分,又知该学生所在年级中有80%的学生成绩低于75分,我们可以表达该生的 【 】

A.标准分为80 B.原始分为80 C.百分等级为80 D.常模分为80 19.教师依据教学目标与计划,请学生持续一段时间主动收集、组织与省思学习成果档案,以评定其努力、进步、成长情形的评价方法是 【 】 A.档案袋评价 B.动态评价 C.轶事记录评价 D.同伴评价

二、填空题(本大题共20小题,每小题1分,共20分)20.测量的三个基本要索是测量的量具、测量的单位和测量的______。21.测量与评价的指导思想是为了______的教育环境。

22.评分者信度指的是多个评分者给同一批人的答卷进行评分的______。23.知识、领会、应用、分析、综合、评价是布卢姆______目标的分类。24.评价标准是由强度和频率、标号、______三个要素构成。25.发展常模可以分为年级常模和______两类。26.标准参照测验的定量标准是______。

27.同伴评定的两种常见方法是人物推定法和______。

28.托兰斯创造思维测验分为甲、乙两式,甲为图形思维创造测验,乙为______。29.人格心理测量与评价的方法有自陈量表法和______。

30.道德心理学家的研究表明,道德的形成与发展有一个他律到自律,再由______的过程。

31.学生身体领域发展目标,本质上是学生的身体发育和______。32.建立评价学生全面发展的指标体系主要包括学科学习目标和______。33.斯塔费尔比姆认为,评价最重要的意图不是为了证明,而是为了______。34.填空题的空白处所填写的应该是______。35.等距量表的零点是______。

36.教育测量与评价在行使行政教育管理的功能中,对教师的管理具体体现在教师资格评

定,教师教学艺术水平的界定,教师管理水平的界定和教师______的界定。37.效标关联效度可分为同时效度和______。

38.基于测验题目的双基度指标下的经验评判法,题目的双基度可在______之间取值。

39.题目区分度就是题目区别______。

三、名词解释题(本大题共2小题,每小题3分,共6分)40.效度 41.课程目标参照

四、简答题(本大题共5小题,每小题6分,共30分)

42.教育评价包含的几个共同的要点是什么?

43.一份高质量的测验蓝图所具有的两个最基本的作用是什么?

43.一份高质量的测验蓝图所具有的两个最基本的作用是什么?

44.测验内容领域规范的四个目的是什么?

45.操行评语法的优点与建议。

46.《中小学评价与考试制度改革》文件的主要精神是什么?

五、论述题(本大题共2小题,第47小题11分,第48小题14分,共30分)

47.如何理解教育改革呼唤教育测量与评价更加科学化?

48.结合教学实际,论述新课程评价改革的重点

2.12现代教育测量与评价 篇二

一、课程内容项目化, 采用项目教学法

项目教学是指以生产中涉及的项目为核心开展教学活动. 根据中小学教学实际需要和数学教学实际应用, 在教学实践中经过反复研究和论证, 把教学内容分为“数学教育测量与SPSS”、“数学测验”、“数学题库”、“数学表现性评价”、“数学课堂观察”五个教学项目. 学生在教师的指导下, 围绕项目开展理论学习和实践操作, 通过小组共同研究, 创造性的解决问题, 得出结论, 提升创新能力、职业素养和团队协作精神.

( 一) 数学教育测量与SPSS

教育测量就是对学生的学习能力、学业成绩、兴趣爱好、思想品德以及教育措施上许多问题的数量化测定. SPSS ( Statistical Product and Service Solutions) 主要用于对教育测量数据进行描述统计、推断统计、相关分析、假设检验及方差分析.

教学目标: 了解教育测量的起源、发展及现状; 掌握测量的相关概念、种类、性质与功能; 针对教育测量中各种数据, 能够选择正确的统计分析法; 能正确读懂解释spss统计分析结果; 熟悉spss的各种统计功能, 理解各种统计分析法的相同与不同, 并能够熟练操作.

( 二) 数学测验

数学测验即学绩测验, 主要是标准化测验和教师自编测验. 通过测验, 教师可以了解学生对知识对掌握情况, 了解学生的能力水平、性格特点、学习动机等, 有利于因材施教. 测验也是评价教育教学对工具, 是教育研究的重要方法.

教学目标: 理解引起测验误差的各种原因与来源, 能够对其进行控制; 掌握信度和效度的定义、作用、估计方法及提高方法; 能够用难度和区分度进行测验的项目分析; 能够对测验分数进行合成和解释; 掌握各种题目编写技巧; 命题双向细目表的编制技能; 会用教育测量与统计软件进行试卷质量分析.

( 三) 数学题库

数学题库是按照一定的心理与教育测量理论, 利用计算机技术实现的数学题目的集合, 可以结合智能组卷软件系统管理题库资源具有科学、高效、经济、灵活、方便等显著特点. 在数学教学过程中利用题库技术及资源, 可以方便高效的进行形成性测验, 可以帮助师生把注意力从名次、得分集中到要实现的教学目标上来, 真正关心学生的学习困难和错误所在, 关注学生素质的提高. 题库建设的理论基础包括教育目标层次分类理论、命题技术理论、经典测量理论 ( CTT) 及项目反应理论 ( IRT) .

教学目标: 了解经典测量理论与项目反应理论; 掌握教育目标层次分类理论; 了解数学题库的优点及建设流程; 会用智能组卷软件系统管理题库;

( 四) 数学表现性评价

数学表现性评价是指将表现性评价应用于学生数学学习过程之中的评价, 具体的是指学生数学学习过程中, 教师根据数学课程目标确定表现性任务, 从而考查学生表现出来的数学知识技能、数学思考能力、问题解决能力及情感态度, 并给予及时反馈, 从而促进学生发展以及自我专业素质的提高. 数学表现性任务主要有开放性问题、调查和实验、数学日记和成长记录袋.

教学目标: 理解数学表现性评价的定义、特点及价值;会进行数学表现性任务的设计与评价.

( 五) 数学课堂教学观察

数学课堂教学观察是指从课堂上收集第一手资料与数据来研究数学课堂, 是研究教学、改进教学、追求内在价值, 面向未来, 是建设性的, 是为了专业发展, 是发展性的. 通过课堂观察技术的训练可以提高听课评课的专业水准, 搜集和积累微观资料; 可使研究更深入细致, 获得教和学的第一手资料, 提供实际讨论中心; 获得实践知识, 汲取改进自己教学的方法技能.

教学目标: 通过有目的的进行课堂观察, 掌握数学课堂观察的流程, 学会从不同维度、不同的视角进行课堂观察;能够运用课堂观察技术记录和分析课堂信息.

二、教学项目任务化

为了突出实践教学, 按照从认知到实践的规律, 把五个教学项目细化为3 ~ 4 个具体的教学任务, 以任务为驱动, 从教师为主导转向以学生为中心, 从课堂情景转向工作情景, 激发学生学习的积极性和主动性, 突出教师职业能力的培养.

( 一) 数学教育测量与SPSS

教学任务: 掌握测量的相关概念、性质与功能→针对教育测量数据, 选择正确的spss统计分析法→解释spss统计分析结果;

( 二) 数学测验

教学任务: 掌握选择题、填空题、解答题等题型的编写技巧→编制命题双向细目表→编制一套数学试卷及评分标准→进行试卷质量分析.

( 三) 数学题库

教学任务: 掌握教育目标层次分类理论→数学题库的优点及建设流程→运用智能组卷软件系统管理题库;

( 四) 数学表现性评价

教学任务: 理解数学表现性评价的定义、特点及价值→选择一种数学表现性任务进行设计 → 评价数学表现性任务;

( 五) 数学课堂教学观察

教学任务: 掌握数学课堂观察的流程→选择课堂观察的维度和视角, 设计观察记录表→进行课堂观察并记录→分析课堂信息.

三、能力培养一体化

本课程的五个教学项目以培养数学师范生教育测量与评价能力为目标, 分为教、学、做三个环节, 每个项目约10个课时. 教: 2 个学时. 教师通过讲解、点拨, 明确相关理论之间的联系, 帮助学生建构系统的知识结构. 通过案例分析, 明确每个教学项目任务, 并对任务进行分解, 帮助学生熟悉掌握具体的任务流程. 学: 3 个学时. 教师提供任务书和指导书, 学生通过自主讨论, 归纳总结, 小组交流, 进行任务方案的设计, 小组内形成方案. 做: 5 个学时, 可以是课内借助上机操作模拟完成, 可以是到中小学校现场研究完成. 学生探究, 小组成员协作完成任务, 提交作业并进行展示, 进行自我评估;

( 一) 教学做一体化的教学模式

(1) 教学设计

根据每个教学项目的教学目标和任务进行教学设计, 提炼知识要点, 明确教学重点难点, 清晰能力要求, 做到具体可行, 每个教学项目教、学、做的时间比以2∶3∶5 为宜. 课堂教学设计要注意教学内容的逻辑安排、教学环节完整、精心安排教学主题, 教学运行过程流畅.

( 2) 教学组织与实施

每个教学项目结合中小学教师工作实际设置问题情景, 精选典型案例, 提出问题, 激发学生学习兴趣, 明确教学目标和任务, 进行理论知识梳理. 对学生进行分组训练, 在解决问题的过程中学习理论知识, 在理论学习的过程中启发思考.

( 3) 教学评价

对课堂教学的评价, 分为“教”与“学”两个方面. 评价学生的“学”, 以实践操作考核为主, 平时表现为辅. 实践操作主要考核学生五个教学项目及任务完成情况, 平时表现主要关注学生在项目学习及任务完成过程, 积极参与, 主动投入, 善于思考、勇于创新, 团队协作, 分析问题, 解决问题.评价教师的“教”, 主要关注教学质量和效率, 教学设计合理, 面向全体, 重视德育渗透, 突出技能训练.

( 二) 多样化的教学方法

在一个完整的教学过程中, 将多媒体教学、案例分析、现场研究、专题研讨、自我评估、全班评比等多种教学方法有机的结合, 解决一个特定的问题. 在教师“教”的环节, 突出理论的分析讲解, 采用具体直观的多媒体教学, 结合精选案例展开分析讨论. 在学生“学”和“做”的环节, 突出能力的培养, 采用现场研究和专题研讨, 教师进行观察和必要的指导, 结合教师的点评及学生自我评估, 加深对所学知识的理解, 培养学生工作实践能力.

四、总结

教学做一体化源自陶行知的“知行合一”教育思想, 并指出“事情怎样做就怎样学, 怎样学就怎样教”, “教学做是一件事不是三件事. 我们要在做上教, 在做上学”.《数学教育测量与评价》课程“教学做”一体化教学过程, 充分体现了“学中做”、“做中学”融为一体的理念. 本课程教、学、做一体化的实践, 符合实践教学、能力培养的目标要求, 可操作性强, 将理论教学和实践操作有机地结合在一起, 激发了学生的学习热情, 调动了学生的主观能动性, 增强了学生的动手能力, 课堂气氛活跃, 教学效果好, 有利于教师教学水平和教学质量的提高. 本课程改革刚刚起步, 在教学实践中, 还需继续对教学项目和任务进行优化及动态调整, 不断进行阶段性总结, 完善教学体系, 提高教学模式的可操作性.

摘要:数学教育测量与评价是一门理论性和实践性都很强的课程, 我系在教学改革实践中, 将理论、实践与能力培养融为一体, 形成由“数学教育测量与SPSS”、“数学测验”、“数学题库”、“数学表现性评价”、“数学课堂观察”五个教学项目构成的课程内容体系, 以项目教学驱动理论学习和实践操作, 实践教学中应加强与中小学教育教学的联系, 培养学生解决实际问题的能力.

关键词:测量与评价,项目教学,实践教学

参考文献

[1]郑日昌.心理与教育测量[M].北京:人民教育出版社, 2011.

3.12现代教育测量与评价 篇三

[关键词]教育测量理论;教育考试;命题

教育考试属于教育评价的一种常用形式,教育评价有形成性评价、过程性评价、终结性评价等多种形态。现代教育测量和评价理论的兴起和发展对教育考试工作提供了直接的科学理论指导,有力地促进了教育考试工作的科学发展。

大规模的教育考试,一方面,希望命题遵循和符合课程标准要求;另一方面,还希望学生通过对问题的分析和解答真实反映他们所掌握的知识和所具备的能力。以上两方面是教育考试的内在需要,但它们往往受到很多现实问题和不确定因素的制约和影响。如课程标准规定的培养目标不一定都是可测的,即使是可测目标也受纸笔考试形式和考试时长的限制等。

近十年来,我们对项目反应理论等现代教育测量理论开展了系统的学习和深入的研究,并在武汉市初中毕业生学业水平考试等大规模教育考试命题及数据分析处理工作中尝试有机地运用相关理论及其模型,并建立了相应的工作机制阳。本文结合实践对大规模教育考试命题工作从理论和技术层面进行分析,从正向和反向提出命题应遵循的有关原则。

一、基于教育测量理论应遵循的几个基本原则

根据教育测量相关理论,为了保证考试学科试题良好的信度和效度,也为了保证学科试题适宜的难度和一定的区分度,理论研究者和学科命题专家对试题设计的程序和方法开展了有益探索,形成既有理论上创新又能指导命题实践的丰富成果。与此同时,理论研究者和学科命题专家也不断归纳和提炼,形成了指导命题工作的关于试题设计的系列基本原则,如适纲性原则、科学性原则、导向性原则等。根据项目反应理论,结合大规模教育考试命题实践,在此我特别提出以下几个补充性原则。

1.能力立意原则

能力立意原则包括:依据课程标准构建对学科能力清晰、完整的认识,建立学科能力结构图;学校教育依据课程标准和教材及学科能力结构,构建学科能力的行为特征目标系统;教育考试以能力考核为主要目的,通过考查知识实现考查能力;教育考试命题以考查学科思维能力为核心,全面考查各种能力,强调能力考查过程的综合性和应用性,强调考查过程和内容的适度开放性。

自20世纪中叶心理学家开始进行能力测量研究以来,对能力形成及其构成和测量的研究一直没有停止过。特别是伴随脑科学研究的深入、信息化技术的广泛应用对能力和要素的认识越来越深刻,测量理论越来越丰富,测量的技术和方法也日益完善和成熟。但因为关于能力的认识具有明显的间接性和主观性,所以对能力的认识也常常包含一定程度的分歧,即使对学科能力要素及其构成也存在认识上的分歧。虽然如此,但人们一致认同学校教育应该培养学生的学科思维能力、创新精神和实践能力;认同大规模教育考试应该突出能力和素质导向;认同知识与能力互相依存,能力在学习活动中逐步形成和发展,能力也在学习活动中通过认识与行动表现出来。

在大规模教育考试中如何有效测量能力是一个颇具挑战性的问题。凯诺尔认为,“教育考试是一个通过设计的过程来诱导学生表现出某种行为,从而推测考生具备某些心理特征”,考试所获得的行为样本要与期望考查的能力之间具有匹配特征,并且两者要可量化考核。

由于不同学科能力要素及其培养目标差异较大,所以对能力的研究、考查要充分结合学科特点和规律来进行。另外,由于学科能力因素的复杂性,能力立意原则的应用也要综合考虑学科能力的构成因素、呈现形式、依存载体及其内在联系。总之,能力立意要通过素材、知识、应用烘托反映出来,并且考试结果可量化分析。

2.内容聚敛原则

内容聚敛原则主要包括:学科考试内容的抽样向学科基础性知识、关键性知识和主干内容聚集;立足学科,在学科内知识点的综合呈现处设计试题,考查学生用综合应用知识(点)来分析和解决问题的能力;创新情景在学科思维和方法交叉层面设计问题,通过此类具体问题考查宏观、抽象层面的学科思维能力。

由于学科知识内容丰富,有的学科知识点分布达数百之多,教育考试不可能覆盖所有知识点。因此,教育考试对内容的选择必须通过抽样来实现,而内容的抽样应该尽可能提高覆盖率。如何提高考试内容的抽样覆盖率和典型代表性,向学科基础性知识、关键性知识和主干内容聚敛是有效的策略。因为学科核心的基础性知识、关键性知识是必须要掌握的,也是必须要考查的,只不过是需要变换考试的题型和知识载体而已。学科主干内容是形成和支撑学科知识体系的骨架,它决定学科知识系统和学科理论的整体性和完备性。同时,也决定了学科主干内容的特殊地位和作用。

学科内有些知识内容通过素材、情景、问题或方法可建立一个整体予以考查;还有的可以通过分层次考查来逐次综合,在知识综合过程中自然渗透考查能力。对学科思维和方法相对具体的学科知识而言属于比较抽象的知识内容,对学科思维和方法类的较高层次的知识,无论其知识的领会与理解,还是其知识的巩固和掌握,乃至其知识的内化与应用对学习者要求都比较高。因此,对此类问题的考查能较好地测量和区分学科思维能力。

在命题时,首先可编拟包含知识能力等要素的双向或多维细目表;然后根据学科知识与能力细目表研究如何在学科命题中依据内容聚敛原则来设计试卷和试题。

3.创新性原则

创新性原则主要包括:对学科试题的内容、形式、问题等创新设计,防止出现雷同试题;通过创新试题考查学生学习的潜能,考查其学科创新思维能力;通过创新问题考查学生的创新意识。

大规模教育考试是周期性进行,对学校起着教育的反拨和引导作用。所以,大规模教育考试要保持适当的连续性和稳定性。但是强调连续和稳定又必须防止僵化和模式化,因此处理好稳定和创新的关系既是现实需要,也是命题工作的技术要求。

教育考试命题对情景的创新、选材的创新、设问的创新是第一层次的创新;对试题结构的创新、试题立意的创新是第二层次的创新;考查创新意识或结合知识、能力来考查创新意识是最高层次的创新。在命题实践中,我们尝试命制开放性问题、测试学科高端认知技能,使用真实情景材料引导学生关注生活和联系实际解决问题、预测学科学习潜能等,教育考试的实际结果分析证明其效果不错。创新是必要的,但创新必须尊重和符合现实;创新要有度,要防止异化,比如繁难偏怪、拐弯抹角、牵强附会等;创新要有技术支撑,比如有意义的情景、可测可评的试题结构模型、创新思维的要素呈现形式等。

二、基于反向控制思想的反向控制原则

教育考试命题是一门学问,命题管理是一门艺术;将教育测量理论与学科教育理论有机结合是一门科学。命题过程中既要按教育测量规律遵循一定的程序和格式,比如编制学科多维细目表、预测试题难度等,也要防止将教育测量理论玄学化、虚化。如果教育测量理论与学科教学理论分离必然会形成两张皮现象,两者不有机结合其科学性就没有保障,对试卷和学生学习水平及能力的评价就没有根基。

命题过程中,既要遵守既定的命题工作规程,坚持按制度、按程序工作;又要确保命题专家独立思考、独立判断,发挥命题专家的创造性和智慧。同时,命题过程中,既要合理分工,让命题专家集中精力思考和创造,又要学科内相互协作,确保充分交流、充分质疑,服从大局、达成共识。大规模教育考试试题是命题专家创造性劳动和相互协作的结晶。命题工作是一个既坚持个人专业观点又合理妥协达成共识的过程。

为了确保命题工作安全、公正、科学,特从实践层面提出以下反向控制原则。

一是有宗教色彩和涉嫌各种歧视的材料坚决不用。歧视包括性别歧视、年龄歧视、地域歧视等。背景资料、试题素材不应选择带有歧视观点的材料,防止有传播不正确价值观的嫌疑,也防止影响考试公正、公平。

二是超出课程标准范围的知识原则上不涉及。学科命题涉及的知识应在课程标准和教材范围之内,但对能力的考查可突破其限制。对课程标准和教材没有要求的知识如果要涉及一定要有交代,要有所涉及知识及过程的介绍。如数学学科可以定义一个课标和教材上没有的新运算来考查学生的理解和运用能力。

三是偏离社会发展主流价值取向、有悖常识和违背科学的素材坚决不使用。社会主义核心价值观倡导坚持以社会为本位,坚持集体利益,而西方价值观是个人为本位,以个人自由为出发点。命题素材要坚持弘扬社会主义核心价值观,要坚持多选用正面素材、积极典型。对宣扬极端个人主义、享乐主义的材料不要选用;对放大社会不公正现象,甚至刻意描写社会诟病的素材要批判性对待;对无从考证、有悖常识,甚至违背科学的材料理应增强判断和辨析能力,不可违背规律、违反科学构设搞创新点。

四是学术界尚存争议或虽达成共识尚未列人公共标准的观点不引用。作为科学家开展研究产生争议是社会发展和科技进步的正常现象,但并非所有研究的内容都可以引入大规模教育考试的。学界尚存争议的观点一旦人题必将引起来自社会各个层面人士出于各种目的的争议,从而影响社会和谐,影响教育秩序的稳定。

五是单纯反映个人学术观点的内容不引用。由于人们的认识是螺旋上升、逐步完善的,即使普遍使用的学科教材中也难免会有认识不到位甚至错误之处。对认识不统一的内容教学中可以引导、启发、组织学生开展探究,教师个人也可以开展针对性深入研究,但是大规模教育考试命题时对个人学术观点一定要慎重对待。因为,大规模教育考试不是传播个人学术观点的工具,不是学术争鸣的平台,不是检测个人学术观点认同的实验。经验和实践证明,凡是命题专家以个人极其擅长和单纯个人学术观点的内容为载体命制的试题,实测效果极差,对学校教育极易产生不正确的诱导。

六是学科组内存在分歧的素材和内容不引用。如果学科组内专家在认识上存在明显分歧,那么一旦作为正式素材和内容形成试题在社会上势必存在阵营对垒式分歧,既妨碍试卷的科学性也有悖公平原则。至于对学科知识内容考查的能力层次问题,由布卢姆教育目标分类理论结合不同学科可以形成不同的理解,所以不同学科对所要考查内容的考试要求不尽相同。有的学科简单分类为了解、理解、掌握三个层次;有的学科划分为识记、理解、分析综合、鉴赏评价等多个层次;有的学科划分为识记、理解、简单应用、问题解决等层次;还有的实验性学科把知识性考试水平分为了解、理解和应用水平,技能性考试水平分为模仿水平、独立操作水平和迁移水平,体验性考试水平为体验水平、反应和领悟水平。对不同层次的考查要求,特别是学科试题呈现的问题设计确属仁者见仁智者见智,这不仅对参加考试的学生具有一定的不确定性,对参加命题的专家同样具有挑战性。正因如此,命题专家的思维空间才留有发挥余地,命题专家的创造性劳动才具备物理性根基。

七是市面教辅资料已经出现过的素材及其试题坚决不用。如果素材对不同群体熟知程度不一样势必影响大规模教育考试的公平性。如果市面教辅资料已经出现过的素材及其试题一旦引用不仅妨碍考试公平性,还冲击考试的安全性。即使对工具书的引用也必须考虑全体考生共同使用的版本。不过,为了引导学校教育防止出现追求偏、难、怪的现象,为了引导学校教育回归本真、回归教材、回归基础,应提倡对学生共同使用的教科书中的素材进行创造性挖掘。实践证明,此举对扼制过重的学业负担、扼制资料过多过滥效果显著。

八是社会过于关注的热点话题尽量回避。学校教育应与社会教育、家庭教育相结合,应引导学生关注生活、关注社会,引导学生应用所学知识分析和解决生活中的实际问题。但大规模教育考试是一种与考生利益高度相关的考试,它对学科考试内容的选择实则是一种有目的性的抽样。大规模教育考试为了实现考试的公平公正,不得不考虑防止押(压)题行为,而社会过于关注的热点往往是市场和学校押(压)题的重要方向。因此,讲政治但不追逐热点、讲应用但不脱离实际、讲综合但不牵强附会,应成为命题工作的智慧选择。

九是立足学科内考查知识的综合应用,慎对跨学科知识的综合应用。虽然引导学生综合性应用所学知识分析和解决问题是教学的追求,学校应通过校本课程和研究性学习等活动大力培养学生综合性观察问题、提出问题、分析问题和解决问题的能力;但是由于目前学校普遍分科设置并实施课程,学科教师单一知识背景情况普遍,特别是命题工作中不可能一个学科命题组由跨学科命题专家组成。诸多现实因素和技术条件的局限,使大规模教育考试考查跨学科知识的综合时机不太理想,因此应大力推进立足学科内来考查知识的综合应用。学科内知识的综合无论从课程、教学、命题技术手段、专家资源等方面,还是从学生学习方法层面,甚至从考查学生进一步学习的潜能角度都具备可操作性。现在各级大规模教育(包括全国高考)都倡导能力立意,即立足学科内考查知识的综合应用成为命题重要的指导思想和技术原则。

总体来说,大规模教育考试命题工作不仅是学科专业性很强的创造性劳动,而且跨学科涉及多门学科理论知识,同时还具有明显的社会属性。加强对教育考试命题工作的研究,不仅有利于提高命题工作的科学化水平,而且有利于引导学校教育教学工作沿着素质教育方向发展。教育考试命题工作承载着学校、家庭、社会多方期望,其影响往往超出命题工作本身。从这个角度来讲对教育考试命题工作要“减压”,即尽可能减少社会因素的干扰,用现代教育测量与评价的理论指导命题工作,让教育考试命题工作沿着专业化方向发展。

参考文献

[1]洛林·W·安德森等.布卢姆教育目标分类学(修订版)[M].北京:外语教学与研究出版社,2009(1).

[2]2014年普通高等学校招生全国统一考试大纲(课程标准实验版)[S].北京:高等教育出版社2014(1):1.

[3]周远方,王池富.高考数学命题理论与实践[M].武汉:湖北人民出版社2011(5):1.

[4]陆璟.PISA测评的理论和实践[M].上海:华东师范大学出版社2013(5):1.

[5]2014年武汉市初中毕业生学业水平考试说明[S].武汉:武汉出版社,2014(3):1.

4.教育测量与评价真题 篇四

现代教育测量与评价学

试卷

(课程代码 6231)本试卷满分100分,考试时间l50分钟。

一、单项选择题(本大题共16小题,每小题1分,共16分)在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均无分。

1.对学生成绩做出优、良、中、差四个等级的分类,实际上是一种 【 】 A.顺序量表 B.称名量表 C.等距量表 D.比率量表 2.我国的科举制度始于的朝代是 【 】 A.西周 B.两汉 C.隋朝 D.唐朝

3.对经常表现出学习困难的学生所做的测量与评价是 【 】 A.形成性测量与评价 B.诊断性测量与评价 C.终结性测量与评价 D.常模参照测量与评价

4.多个评分者给同一批人的答卷进行评分的一致性程度,我们称之为 【 】 A.重测信度 B.复本信度 C.同质性信度 D.评分者信度

5.由强度和频率、标号、标度三个要素构成的,衡量评价对象达到评价指标要求的尺度,我们称之为 【 】,A.评价指标 B.指标体系 C.评价权重 D.评价标准 6.学生的操作实验技能考核是属于 【 】 A.客观测验评价法 B.主观测验评价法 C.表现性测验评价法 D.评定量表评价法

7.图形再认测验、视觉保持测验或图形记忆测验等是属于 【 】 A.文字记忆测验 B.非文字记忆测验 C.综合性成套记忆测验 D.思维能力发展测验

8.智力测验在社会历史舞台上获得 13.为评价学生在课堂讨论中所表现出来的积极性,教师用5—4—3—2—1来表示,这属于

【 】

A.评定量表评价法 B.数字等级评定量表评价法 C.图示等级评定量表法 D.等级评定量表法

14.语文学科中的诗歌创作和命题作文是属于想象能力测量与评价方法中的 【 】 A.作品分析评价法 B.心理测验评价法 C.记忆测验评价法 D.思维测验评价法

15.由测验专家严格按照测验编制程序而编成的测验称之为 【 】 A.团体测验 B.标准化测验 C.能力倾向测验 D.人格测验 16.测验蓝图是编制试题的 【 】

A.指导和依据 B.思想和方法 C.比例和难度 D.目标和结构

二、填空题(本大题共12小题,每小题2分,共24分)请在每小题的空格中填上正确答案。错填、不填均无分。

17.无论是直接测量还是间接测量,要实现这些测量必须具备测量的三个基本条件:一是要有测量的量具;二是要有意义相对明确的测量 ;三是需要有一个测量或

计算的起点,这个起点叫。

18.物理量的测量大多是 性的,教育测量大多是 性的。

19.美国的格兰朗德认为一个完整的评价计划可以用公式来表达,即:评价:= +非测量(质的记述)+。

20.现在学者一般认为,我国的考试制度在 已见端倪,我国的考试制度正式建立。

21.能力倾向测量与评价一般可以分为两种:一种是关于 倾向的测量与评价,另一种是 倾向的测量与评价。

22.测验题目基本上可以分为 和 两大类。

23.布卢姆将认知领域的目标按照由低级到高级的难易程度形成一种递进的等级关系分为

六个类别、领会、运用、、综合、评价。24.依据解释测验参照点的不同,可以把测验分成 参照测验和 参照测验两种类型。

25.档案袋评价有不同的类型,但用于班级学生评价的档案袋基本上可以分成 档案袋、过程型档案袋和 档案袋三种。

26.知识行为测评法又称为,人格测验中的问卷测验法又称为。27.思想品德测评有利于发挥评价的教育功能。通过测评可以实现: 功能、功能、反馈功能、教育功能、预测功能。28.《体育与健康》课程总目标把课程内容分为五个学习领域,它们分别是运动参与、运动技 能、、心理健康和 五个领域。

三、名词解释题(本大题共3小题,每小题4分,共12分)29.终结性测量与评价 30.最佳行为测量与评价 31.体能

四、简答题(本大题共4小题,每小题5分,共20分)32.教育评价的共同要点是什么? 33.表述得当的教育目标必须符合哪些要求? 34.如何理解学生品德形成的“基本维度说”?

35.如何理解身体领域发展目标?

5.《教育测量与评价》教师读书笔记 篇五

广义地讲,所谓教育评价是指按照一定的价值标准和教育目的,利用测量和非测量的种种方法系统地收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。从中,我们不难发现教育评价包含如下几个要点:

第一,强调以教育目标为标准的价值判断过程。

第二,强调用多种方法(测量和非测量)系统收集资料与信息。

第三,教育评价的内容既可以是教育计划,也可以是课程;既可以是学生的学习结果,也可以是某种教育现象、教育活动、教育目的或教育程序。

第四,强调为学生发展和教育决策服务。

狭义地讲,我们把教育评价界定为:是根据一定的目的和标准,对教育工作及其有关因素中的状态与绩效进行描述并在此基础上进行价值判断的活动。这种界定含义包括以下几个方面:

首先,揭示出教育评价必须建立在一定依据和标准之上。这个依据不单是教育目的,它还是各种教育活动的目标、各科教学的目标,甚至是为了了解教育革新方案的效果的目标,然后,依据目的制定出教育评价的指标标准。

其次,揭示出的评价对象是“教育工作及其有关因素的状态与绩效”,意在说明评价的对象既包括各种教育工作(教学工作、思想工作、管理工作、人事工作、总务工作等),也包括各种教育活动人员;既包括教育活动发生发展的过程(状态),也包括教育活动的最后效果(绩效);既可以是对某一工作或某种人员的评价,也可以是多方面的评价。再次,这种描述并在此基础上的价值判断,不是随意的、简单的,而是建立在系统收集的客观资料基础上,运用相当的技术手段,不仅要进行量化的测定与分析,而且还要进行定性的分析,是一种以描述为基础、价值判断为根本的`活动。

二、教育评价的发展历史

(一)国际上教育评价的发展历史

自19世纪中叶起到本世纪30年代的八十多年,为教育评价的第一个时期──“心理测验时期”。教育测量的研究取得了一系列的成果,在考试的定量化、客观化与标准化方面,取得了重要的进展。强调以量化的方法对学生学习状况进行测量。然而,当时的考试与测验只要求学生记诵教材的知识内容,较为片面。无法真正反映学生的学习过程。

到20世纪30年代―50年代是教育测量的第二个时期──“目标中心时期”,身为美国心理学家俄亥俄州州立大学教授的泰勒提出了以教育目标为核心的教育评价原理,即教育评价的泰勒原理,并明确提出了“教育评价”的概念,从而把教育评价与教育测量区分开来。教育评价学就是在泰勒原理即“行为目标评价模式”的基础上诞生与发展起来的。在西方,一般人们都把泰勒称为“当代教育评价之父”,而这个时期的教育评价在美国历史教育史上称为“泰勒时期”。也就是说教育评价真正从教育测量活动中发展出来的是始于1933年至1940年泰勒的“八年研究”。

60年代(20世纪50―70年代)是教育测量的第三个时期──“标准研制时期”。以布卢姆为主的教育家,提出了对教育目标进行评价的问题,由美国教育学家斯克里文、斯塔克和开洛洛等人对教育评价理论作出巨大的贡献。学者们把1967年界定为美国教育评价发展的转折点。

到了20世纪70年代以后,教育评价发展到第四个时期──“结果认同时期”。这一时期在非常关注评价结果的认同问题。关注评价过程,强调评价过程中评价给予个体更多被认可的可能。总之,重视评价对个体发展的建构作用,因此,又称为“个体化评价时期”。

(二)我国教育评价的发展趋势

当前,在实施素质教育的过程中,我国的教育评价呈现出以下几个发展趋势:

(1)教育评价内容的全面性。

(2)教育评价方法的多样性。

(3)教育评价主体的多元化。

(4)日益注重教育评价的教育性和发展性功能。

三、教育评价的功能

格朗兰德认为评价的.主要目的是改进学习和教学,所以评价结果的其他用途,都是第二位的或补充性的。我认为教育评价的功能可以归纳成如下:

(一)导向功能

所谓评价的导向功能,是指评价可以引导评价对象趋向于理想的目标。教育评价是目的性、规范性很强的活动,合理的评价活动具有鲜明的评价目的、预设的评价标准以及严格的评价程序,就像一根“指挥棒”,对教育发展起着“定标导航”的作用。

(二)诊断功能

教育评价通过获取教育活动的实际状态、影响教育活动过程发展方向的各种因素以及教育活动对参与者的影响等方面的信息,对其进行整理、分析,能够发现教育活动或被评对象哪些方面欠缺或偏离目标的要求,使被评对象发扬成绩,改进不足。

(三)鉴定功能

鉴定,意指对教育活动成效优劣的甄别。鉴定具有选拔、分等的效能,能实现对同类评价对象之间优劣高低的比较。在教育评价中,鉴定可以归为三种类型:

一是水平鉴定,根据一定的标准,鉴定评价对象达到标准的程度。

二是评优鉴定,即通过对评价对象相互之间的比较,评定优者。

三是资格鉴定,即对评价对象是否具有从事某种活动的资格进行鉴定。

(四)改进功能

6.12现代教育测量与评价 篇六

一、单项选择题(本大题共10小题,每小题1分,共l0分)

1.B2.D3.C4.A5.B6.A7.D8.C9.A10.B

二、填空题(本大题共10小题,每空1分,共20分)

11.桑代克12.量具、单位、参照点13.内容效度、结构效度、效标关联效度

14.标准15.信度、难度16.教育测量与评价17.非文字测验18.0.50

19.法则、事物、数字20.称名量表、顺序量表、等距量表、比率量表

三、判断题(本大题共5小题,每小题2分,共10分)

21.X22.√23.X24.X25.√

四、名词解释(本大题共5小题,每小题4分,共20分)

26.教育测量:是针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。

27.教育评价:是指按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统地收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据和过程。

28.标准化测验:是指由测量专家严格按照测验编制程序而编成的一种测验。

29.测验信度:是对测验工具及其操作的整体质量的整体质量的一种量度,是测验性能的重要质量指标。

30.效度:指一个测验或量表实际能测出所要测量的特性的程度。

五、简答题(本大题共5小题,共30分)

31.答:教育测量与教育评价既有区别又有联系。

教育测量与评价的联系表现在:第一,教育测量是教育评价的基础。教育测量是对教育进行量的确定,所得结果是教育评价所需信息可靠的主要的来源,是对教育的状态与价值进行客观判断的前提;第二,教育测量的结果只有通过教育评价这个环节才有实际意义,否则变成了一堆枯燥的数字。

教育测量与评价的区别表现在:第一,着眼点的不同,教育测量的着眼点是取得数据,教育评价的着眼点是做出价值判断;第二,特点不同,教育测量是纯客观的,教育评价则是主客观的结合;第三,复杂程度不同,教育测量较单一,教育评价较复杂,教育测量是定量描述,教育评价重质的判定,含定量与定性。

32.(1)按测量与评价在教学中运用的时机分类;(2)按解释测量结果或评价结果时的参照点分类;(3)按测量与评价被试行为表现的性质分类;(4)按测量与评价的内容分类;(5)按测量对象多少分类;(6)按测验材料分类;(7)按量具的标准化程度分类。

33.答:区分度的分析方法,大约可以归纳成两类:一为外在效标法,即分析被试

在测验题目上的得分与外在客观标准上的表现之间的关系。另一为内部一致性法,即分析被试在测验题目上的得分与在整个测验总分之间的一致性程度。在实际操作中,主要使用后者,从这个意义上说,区分度的实质,就是题分与总分的相关程度。

34.教育测量与评价方案的可用性要考虑:科学性,可行性,公平性,针对性,区分性,简洁性。

35.教育测量与评价的主要功能:

(1)实现教育判断的功能:测量评定的功能,事实判断的功能,价值判断的功能,问题诊断的功能,区分选拔的功能。

(2)改进教师教学的功能:了解学生的起点行为,作为改进教学的参考,作

为补救教与学的依据,确保教学目标的达到。

(3)促进学生学习的功能:激励学生的学习动机,帮助学生的记忆和促进迁移,促进学生自我评价。

(4)行使教育管理的功能:对教师的管理,对目标的管理,对过程的管理。

在新课程改革中,我们要注意发挥测量与评价的积极功能。

五、论述题(本大题共1小题,共10分)

36.答:测验的试题类型基本上有两大类:主观性试题与客观性试题。

客观性试题的优点表现在:一般是用于测量知识的掌握、理解、应用、分析几个层次的教学目标。客观性试题的答案明确,评分客观,作答简便,因而在限定的时间内测验可以包含足够数量的试题,能保证对知识内容的覆盖。缺点表现在:不能测量综合、评价等高层次的教育目标,并且贬值也较复杂;不利于提高被试者的创新能力与综合性能力。

7.12现代教育测量与评价 篇七

新生入馆教育是每个高校图书馆每学年都要面临的周期性的读者培训工作, 其目的在于引导新生学会如何最大限度地利用图书馆的丰富资源, 帮助新生尽快熟悉和有效利用图书馆。新生入馆教育是高校图书馆对学生最初始的服务, 具有重要意义。“新生入馆教育是指图书馆按照学校总体规划, 根据新生特点并结合图书馆的实际情况, 有计划、有步骤地针对新生实施的引导、教育工作。图书馆的新生入馆教育工作是高校图书馆信息素质教育的一项重要内容, 是一项既需要丰厚的综合能力、耐心细致的工作态度, 又需要多方面协调、全面考虑的综合性工作。”[1]现代高校图书馆的学习资源也越来越丰富, 除了有大量的纸本图书可供学生借阅学习, 还提供优质的学习资源进入平台, 学生可以通过图书馆接触到世界各地最新的知识与信息, 是学生进行自主学习最佳的场所。是否能良好的利用图书馆将对每一个高校学生产生深远的影响。

图书馆虽然承担着每一学年的新生入馆教育工作, 但对于这一项教学工作却一直没有建立一个测量评价体系, 对入馆教育的教学效果缺乏客观测量数据及科学的评价体系, 这对新生入馆教育工作的开展是极为不利的。在新生入馆教育中建立建成一个科学有效的测量评价体系是教育现代化、科学化的体现, 也将给新生入馆教育工作带来质的飞跃。

1 教育测量、教育评价简介

“教育测量是根据测量学的原理和方法对教育现象及其属性进行数量化研究的过程。它主要包括对学生内在精神属性的测量, 如测量学生的学习成绩、智力水平、品德状况、人格特征等方面。”[2]也就是说教育测量是以受教育者 (学生) 为测量对象, 根据特定教育目的而设计对行的一种测量活动。而教育评价则是在教育测量的基础上对测量对象即受教育者所进行的一种评定和判断行为。“教育评价是根据一定的教育价值观或教育目标, 运用可行的科学手段, 通过系统地搜集信息、分析解释, 对教育现象进行价值判断, 从而为不断优化教育和教育决策提供依据的过程。”[3]可以说教育测量与教育评价是相辅相成的, 共同为更好地进行教育活动提供服务, 也有很多研究者将它们统称为教育测评。

2 在入馆教育中建立教育测量评价体系的重要性

“在社会信息化环境下, 对高校学生的要求已经不仅仅是具备一定的专业素质, 还要具备相当的信息素质, 也就是要具备在图书馆或其他信息机构检索自己所需信息的能力, 具备对多元化信息高速、有效处理的能力。只有这样才能使学生拥有持久的学习能力”[4]。图书馆新生入馆教育是大学生信息素质教育的开端, 是大学教育进程的重要组成部分, 是一项需要引起重视的教育课程。

长期以来, 图书馆虽然承担着新生入馆教育的教育工作, 却几乎从没有对这项教育工作进行过测量和评价工作。这使得入馆教育缺乏完整性, 也必然难以引起学生的重视, 直接影响教育效果。另一方面, 图书馆教师对学生的学习过程及结果缺乏科学的测评数据, 对自身的教学效果难以进行相应衡量及检验, 影响教学方法与手段改进及提升。在入馆教育中建立测量评价体系将极大地改善这两方面的缺陷与不足。相关的研究和实践表明, 教育测量评价体系具有导向、激励、改进、鉴定和教育等几种功能。“测量评价体系可以将教育目标具体化、系统化和量质化, 具有较强的科学性和可操作性, 教育者和受教育者都可以将评价体系中的目标和标准作为教与学的行动指南”[5]。在新生入馆教育中建立测量评价体系, 可以使之正规化, 引起学生足够的重视, 提升学习效果, 而教师有了相关的教育测评数据, 可以据此调整改进教学方式, 改善不足之处, 对入馆教育工作进行更为科学合理的设计, 进一步提升教学效果。可以说在新生入馆教育中建立测量评价体系无论对教师和学生是一个双赢设置。

3 如何在新生入馆教育中建立测量评价体系

首先, 根据新生入馆教育的目的设定几个阶段性目标, 第一阶段:了解图书馆的规章制度, 馆舍结构及藏书分布, 能自觉遵守图书馆的各项规定;第二阶段:了解图书馆的资源与服务, 会独立查目录、借还书, 能续借和预约图书;第三阶段:学会利用图书馆的虚拟资源, 能检索到自己需要的资料。图书馆工作人员可总结多年的图书馆新生入馆教育经验, 根据不同阶段的教育目标建立起新生入馆教育题库, 题库主要有两种类型的试题, 即选择题和判断题。

学生经过入馆教育培训后可以凭有效证件号码和密码进入入馆教育测评体系。此时系统可以根据试卷规则自动抽取测试题库中的题目, 组成一份试卷由学生作答。学生测试完毕提交后, 系统将进行自动阅卷, 马上给出相应评价结果。前一阶段过关才能进行下一阶段的测评, 测评不过关则要求重新进行相应阶段的学习, 三个阶段测评都完成后, 系统通过图书馆业务管理系统提供的接口自动完成新生记录的初始化, 并提示管理员办理借阅证或开通学生一卡通的图书馆使用功能。通过上述入馆教育及入馆测评之后, 学生便可享受图书馆的资源和服务了。

题库由管理员在后台实时维护, 其内容的建设最好有图书馆一线的管理人员直接参与, 因为他们最了解新生入馆后会出现的一些问题。管理员登录系统后台, 可以编辑测试题库、管理试卷的题型、题量和对应的分值。同时管理员在系统后台也能够维护新生信息, 通过统计分析新生的测试成绩, 提供及时反馈, 监控学习, 保证学习质量, 把握住每个学生的目标达到度。通过测评体系管理员可以全面了解“入馆教育”的有效性及学生学习的难点所在, 便于进一步调整教学方法和测试题库的内容, 为今后的工作打下基础。

分阶段的测评体系可以充分发挥以评促学的功能, 学生不会觉得难度过高而产生畏难或厌学心理, 及时给出的评价结果激励学生进入下一阶段的学习。学习目标细分化也有助于管理员将精力集中到学生的学习重难点上, 提高教学效率。

4 结语

新生入馆教育测评体系的设置, 确保通过测评后的新生都已经对图书馆有了足够的了解和认识。入馆以后, 不会给图书馆的日常管理工作带来困扰。图书馆作为学校的信息资源中心, 是大学学习进程的重要组成部分, 图书馆的利用效果将直接影响到学生的学习效率, 经过测评的新生具备了利用图书馆的初步知识, 在利用图书馆的过程中他们更易于培养热爱图书馆、热爱学习的情趣。

图书馆的可持续发展离不开读者, 没有良好的入馆教育, 新生难以成为忠实的读者。图书馆要推广自己的资源和服务首先必须要从让读者了解图书馆开始, 从而善于利用图书馆, 进而热爱图书馆。新生入馆教育是学生了解图书馆的初始步骤, 这一教育目际完成的好坏, 不仅影响学生对图书馆利用能力, 而且影响图书馆的可持续发展。在新生入馆教育中建立测量评价体系可以大幅度地提升教育效率, 使入馆教育的教育目标的得到确切的实施, 从而为图书馆的可持续发展提供保证。

摘要:新生入馆教育是每个高校图书馆每学年都要面临的周期性的读者培训工作, 其目的在于引导新生学会如何最大限度地利用图书馆的丰富资源, 帮助新生尽快熟悉和有效利用图书馆。新生入馆教育的效果, 将会直接影响学生在今后的大学生活中对图书馆的利用率, 更有助于他们到了高年级阶段学习掌握更专业的利用文献信息的技能。本文分析了测量评价体系要新生入馆教育中的功能作用, 提出了在新生入馆教育中建立测量评价体系的设想。

关键词:新生入馆教育,教育测量,教育评价

参考文献

[1]南玉霞.开展具有学校特色的新生入馆教育——以中国传媒大学图书馆为例[J].高校图书情报论坛, 2010, 9 (1) :37-40

[2]胡中锋主编.教育测量与评价[M].广东高等教育出版社, 2006年3月第二版, P6

[3]胡中锋主编.教育测量与评价[M].广东高等教育出版社, 2006年3月第二版, P11

[4]周茜.浅谈高校图书馆新生入馆教育.漯河职业技术学院学报, 2008 (6) :117-118

8.幼儿教育呼唤现代评价观 篇八

关键词:幼儿教育;现代评价观

长期以来,教育评价时时左右着幼儿教育的方向,左右着广大幼教工作者的观念与行为。一位专家说得好:评价在教育实践中起着有力的杠杆作用,但这一作用却未必一定把教育推向理想的方向。

一、幼儿教育中对教师的评价

园长对教师的评价要多一点尊重,少一点苛刻,少一点吹毛求疵,用科学的、公正的评价促进教师的自我成长。

有人说幼儿教师是“多管局”局长,幼儿的吃、喝、拉、撒什么都管;有人说幼儿教师是“万事通”,弹、唱、说、画、写、跳等十八般武艺样样都要会。而现代教育更要求教师既要成为研究型加学者型的理论型教师,又要成为掌握现代教育手段,能运用现代教育观组织教育教学的实践性人才。因此,评价幼儿园教师的工作并非易事。那么如何做到客观、公正评价教师,有效地促进教师的自我成长呢?笔者认为评价者本身应具有良好的心理素质和较高的幼教专业素养。

1、作为评价者,园长首先要学会尊重教师。尊重教师是指评价者(管理者)要尊重教师的人格、需求和劳动。教师与管理者是平等的幼教工作者,园长切不可以居高临下的姿态对教师的工作指手划脚、评头论足,而应对一线教师的辛勤劳动给予充分的肯定,帮助他们总结经验,和他们共同探索需要改进的地方,客观地评价教师的工作成绩和问题。管理者应明确评价教师工作的目的不是挑选人才、划分等级,而是为了更好地优势互补,以有利于教师间相互学习、共同提高,促进他们的自我成长。而有些园长往往不懂装懂,妄加评论,他们中有的人会对那些因怕出事而整天把孩子圈在教室里的教师大加赞赏,而对一些把孩子带到田野、小溪边活动的老师予以指责。曾有老师抱怨说:我们最不喜欢园长在听课的时候就发表议论,这对我们是极大的不尊重。

2、作为评价者,园长要学会宽容理解教师。宽容理解教师,就是要给予教师发展的空间,激励教师在促进儿童快乐成长的过程中,自身也得到发展的快乐。这就要允许教师进行一些创造性的尝试,允许他们有自己的设计和想法,允许教师也有“不会”的时候。面对《纲要》中的新理念,教师可能会有一段时间的不知所措,这时园长更要宽容理解教师的“不会”,促使教师说出自己的困惑,并能与教师共同面对新的挑战,这也是将《纲要》的学习与贯彻不断引向深入的关键点。在平时的工作评价中,园长不要苛求教师所说的每一句话、所做的每一件事、所组织的每一次活动都完美无缺,而应给予教师一个逐渐完善、自我调节、自我改进的过程。

二、教师对幼儿的评价

教师对幼儿的评价要多一点赏识,少一点否定,用多元的、发展的评价促进幼儿富有个性地发展。

1、评价的内容要多元化。多元智力理论认为:每个儿童都不同程度地拥有八种智能,都拥有相对于自己或是相对于他人的智力强项。因此,对一个幼儿不可用好与不好、聪明与不聪明来评价,而应综合地看待他(她)的认知、情感、态度等各个方面的发展状况,发现每个儿童的智力潜能与特点,识别并培养他们区别于他人的智能和兴趣,帮助他们去实现富有个性的发展。

2、评价的方法要多样化。许多幼儿园都存在“星期五”现象,离园时许多孩子的额头上贴上了一朵小红花。如果有心人问孩子,老师为啥给你贴上小红花,她会说:“因为我表现好。”当追问“你什么地方好”时,有些孩子则茫然不知如何作答。有的老师则用“七色花”来代表孩子多个方面的能力,并随时根据孩子发展的情况给他贴上相应颜色的花。每当孩子得到一朵花,他就会自豪地说:“我在礼貌方面又进步了。”这种评价方法值得大家借鉴。我们还可以从幼儿的心理需要出发,有针对性地使用多样化的评价手段来满足每个孩子的不同需要。如当一个胆怯的孩子勇敢地跨过“小河”时,给他一个拥抱;当一个粗鲁的孩子学会使用礼貌用语时,向他竖竖大拇指;当一个哭闹的孩子愿意上幼儿园时,奖给他一个吻等等。此外还可以让孩子学习自我评价、相互评价,教师也可通过作品分析、行为观察、谈话等多种途径使评价的结果更加客观、公正。

3、评价标准尽可能多层次化、个体化。《纲要》指出,对幼儿发展状况进行评估时应注意承认和关注幼儿的个体差异,避免用划一的标准评价不同的幼儿,在幼儿面前慎用横向的比较。而目前在幼儿园中,用同一标准评价幼儿的现象很普遍。近期有一篇文章介绍了这样一件事:当一位幼儿不幸溺水身亡之后,班上的一位老师怎么也回忆不起该幼儿的笑靥,由此,引起了这位老师的深刻反省和良心上的忏悔。这难道不值得我们广大幼教工作者反思吗?为此,教师就不能将关注每一个幼儿的发展视为一句空洞的口号,而要将它转化为自己工作中实实在在的行为,在这个方面,教师要善于学习与借鉴国内外先进的评价思想与手段,如在美国,当孩子毕业时,老师送给孩子的珍贵礼物是一本装帧得很漂亮的书——幼儿在园三年的所有作品。以这些作品和教师对幼儿的观察记录为基础,教师对每个孩子的评价凸现了个体化特征。

三、结语

幼儿园对于教师的评价,相信教师、理解教师、尊重教师、善待教师,这才是现代教师评价观的精髓所在。同时评价活动还应该帮助教师明确儿童在各个课程领域已经掌握和正在发展的技能。评价还应基于这些为课程理念和教学实践提出建议,使这些观念和建议能够与每个儿童的学习纵剖图相吻合,并适宜于整个班级。具体到每个评价活动,都应该给出延伸扩展评价活动的建议,以促进儿童的学习。

参考文献

[1] 虞永平,彭俊英.对我国幼儿园课程评价现状的分析和建议[J].人民教育,2003(11).

[2] 姜勇,刘霞.当前我国幼儿园课程评价存在的问题与对策[J].教育导刊,2002(6).

[3] 張小庆.多元智力理论对幼儿教育评价的启示[J].长春工业大学学报(社会科学版),2004(3).

上一篇:注水站无人值守方案下一篇:关于去四川的作文400字作文范文