郑日昌心理测量学-第5部分
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
对文化背影影响测验分数的问题已经研究了很多年,最初,有些研究者企图发展排除文化影响的测验,可是人们很快就认识到这是行不通的,于是又转向编制所谓文化公平的测验。还有人根据亚文化群的特点,为不同文化背景的团体编出不同的量表。 所有这些努力都取得了一定的效果,我们认为所谓公平只是相对的,更重要的是找出造成各个团体文化差异的因素,然后再去设法消除它。
过去,某些人脑子里有这样一个公式:心理测验=智力测验=智商=遗传决定论,这实在是对测验的一种误解,正是这种误解,使心理测验蒙受了长期的不白之冤。
二、对测验的正确态度
(一)测验是研究心理学的一个重要方法和作决策的辅助工具。
俄国化学家门捷列夫说过:“从开始有测量的时候,才开始有科学。”
从心理学的发展史来看,心理测验是在心理学由思辩科学转向实验科学后产生的,对行为的客观测量代替了内省法,这是—个进步,是继实验法之后,在心理学研究方法上的又一次唯物主义尝试。测验法较之观察法和旧法考试更推确、更客观。同时由于测验对被试的取样大,并能研究较为复杂和高级的心理现象。因而可弥补实验法的某些不足。有人承认通过测验法所得到的心理学理论, 却反对测验法本身,实在是一件很荒唐的事,但是,我们也应看到,测验不是鉴别个别差异的唯一方法,更不是万能方法。任何一种方法都有自己的长处和短处,测验的作用是有限的,只有把各种方法结合起来,才能对人的心理现象做出全面的考察。当现实需要我们做出决定时,我们应当采用最有效的信息,如果它能从测验分数得到,那就使用测验,如果别的方法能提供更好的信息,那就不用测验,重要的是对各种方法的功效做出评价,权衡利弊,尽可能公正地客观地采用最理想的程序。
现在的问题是,我们一方面责难心理测验不准确、不可靠、不科学,另一方面却又大量使用更不准确,更不可靠、科学性更差的旧法考试。在升学,就业、招工,晋级、长工资、授学位时用一些未经标准化的测验来作筛选,甚至以一次考试定终身。自己的东西因为用起来顺手,尽管有许多弊端,也舍不得丢掉,别人的东西,尽管有某些长处,因为自已不熟悉,便拒之门外。崇洋媚外,月亮也是外国的圆,固然不对,但闭关自守,抱残守缺,也未必好.正确的态度应该象鲁迅先生说的那样,对外国一切好的东西都采取拿来主义,为我所用。
(二)测验作为一个研究手段和测量工具尚不完善
心理测验无论在理论上和方法上都存在不少问题,绝不能认为测验分数对于人们的能力和人格提供了非常准确可靠的指标,在对测验分数作解释,尤其是对个别人做预测时必须十分小心。
在某些情况下,测验使人做出了错误的决定,但在更多的情况下,测验能为我们提供用其他方法得不到的有用信息。我们不应该重犯倒洗澡水把孩子也泼掉的错误。
心理测验的主要问题是缺乏坚实的理论基础,关于智力和人格目前还没有统一的定义和理论。有人可能会质问心理学家,你们连什么是智力和人格都没搞清就想要测量它们,岂不荒唐?我们说这种情况在科学史上是屡见不鲜的。譬如,在对万有引力定律、一无所知时,人们仅根据简单的杠杆知识就能称物体的重量,在认识到物体受热分子运动加速以前,人们仅根据热胀冷缩这一现象就可以测量物体的温度。正是由于秤和温度计等测量工具的发明与使用,促进了对物理现象的研究,发展了物理学理论。
世界上第一把石斧绝不会削铁如泥,世界上第一杆秤也绝不会量出一克的千万分之一。任何一个工具只有在使用中才能发现它的弊端,从而不断改进和完善。如果当初因为秤不够准,刀不够快就禁止使用,那么今天的电子天平和金属切割机就绝不会产生。
(三)为了更好发挥测验的效能,必须防止测验的乱编滥用
测验是个有用的工具,但对测验的使用必须加以控制。测验之所以遭到一些人的反对,除了测验本身的问题外,在很大程度上是由于测验的误用带来严重的社会后果,败坏了测验的信誉。
为此,美国心理学会于1954年制订了《心理学家的道德准则》和《心理测验与诊断方法的技术建议》两个文件,对测验的发行和实施原则做了明确规定,对使用者的资格也做了严格的限制。
前车之覆,后车之鉴。目前,测验在我国刚刚兴起,我们应该一开始就强调它的科学性、严肃性,使之沿着正确方向发展。为了防止测验的乱编滥用,要注意以下几个问题:
1.测验的编制和修订要注意科学性
编制和修订心理测验是一项十分复杂的工作,必须由有关领域的专家来主持。他们不但要对该领域(如智力、人格等)的心理学理论有较深造诣,而且要通晓测验的基本原理和编制技术。对心理学和测量学一窍不通或一知半解就来编制或修订测验是应该禁止的。
测验的首要条件是标准化。标准化测验在编制时要遵循特定的程序,不但要有统一的内容、施测程序和评分方法,而且要有较高的效度和信度,还要有解释分数的常模资料或其他参照标准。即使国外广为流行的测验,在引进时也必须根据试测结果修订常模和某些不合适的题目,简单照搬或仅凭主观经验稍加更改就拿来应用,是很危险的。
2.测验的出版和发行要严加控制
对于大多数心理测验来说,泄露测验内容,可能会使测验失效。因此,对测验的出版发行必须严加控制。不应在科普读物上发表测验题目,在一般公开发行的书籍上,(包括某些教科书)介绍能力或教育测验需要举例时,最好用模拟题目。编制和修订一个测验需要很长时间,有的测验经过几十年的使用和反复修订已渐趋完善,一旦公开发表,便整个报废。某些人格测验对题目的保密要求虽然不象能力测验那样强,但广为散发也会增加误用的可能性,造成不良的社会后果。为了保护测验,防止测验失密,不让一般人熟悉测验内容,需要有相应的出版法来保证。
正式发行的测验,必须备有详细的测验手册或说明书,不仅要讲清施测和计分方法,而且应提供足够的信息以使得人们能对测验本身做出评价,没有效度和信度资料的测验是不能发行的。目前在一些科普刊物上登载的测验多半是游艺性的,不能正式拿来使用。在宣传和介绍测验时要实事求是地讲清测验适用范围,指出其不足和局限,不要夸大测验的功能。
3.测验使用者要具备一定的资格
测验的选择、施测、计分和解释都必须由受过专门训练的心理学工作者,教育工作者或医生来进行。一般说来,个别施测的智力测验和大部分人格测验对使用者的要求较高,而学绩测验的使用者只要受过初步训练即可。
测验的使用者既要有能力,又要恪守一定的职业道德。在宣传和分析测验结果时要谨慎行事,要考虑对当事人可能产生的影响,在一般情况下,告诉当事人的应是对结果的解释,而不是简单宣布一个分数,要保护受测者的利益,如对测验结果保密等,如果发现受测者在能力、人格或学习上存在某种问题,要给以辅导和帮助,并尽可能提供相应的教育和治疗上的措施,把诊断与矫正结合起来。
我国著名心理学家陈立先生在一篇文章中谈了对测验的看法,他在充分肯定测验是一个有用工具的前提下,特别表示了对目前社会上乱编、滥用测验的关切。每一个心理测量工作者必须牢记陈老的告诫。
4.要学习和宣传测量理论
乱编滥用测验的根源在于不懂测量理论。为了解决这个问题,有必要提倡心理学和教育学工作者学点测量学对广大教师宣传和普及测量理论,促进考试科学化,亦属当务之急。对国外测量理论和测验一样,也要加以适当改造,使之适合我国国情。
第三章 心理测验的编制
工欲善其事,必先利其器。为了在研究工作和实践中更好地发挥测验的效能,首先要编制出各种高质量的、合用的测验。
第一节 编制测验的一般程序
编造测验的方法,依测验的性质而异。不同类型,不同用途的测验,编制的具体过程是不同的。但由于测验原理大体相同,因而可以概括出一套通用的编制程序。
总的说来,编制心理测验一般要经过以下几个步骤,确定测验的目的,制定编题计划,编辑题目,题目的试测与分析,集合成测验,将测验标准化,对测验的鉴定,编写测验说明书。
一、确定测验的目的
(一)测量对象
在编造测验前首先要明确测量对象,也就是该测验编成后要用于哪些团体。只有对受测者的年龄、智力水平、社会经济和文化背景以及阅读水平等心中有数,编制测验时才能有的放矢。
(二)测量目标
所编的测验用来测量什么,是测能力、人格, 还是学业成就,也是必须首先考虑的问题。不但要明确测量的目标,还要对测量目标加以分析,将此目标转换成可操作的术语,即将目标具体化。如美国著名测验学家瑟斯顿通过因素分析,将智力分解为七种基本心理能力:
语文理解——阅读时了解文义的能力。
语词流畅——正确迅速拼字与敏捷联想词义的能力
数字运算——正确而迅速使用数字解答算术问题的能力。
空间关系——运用感觉器官及知觉经验正确判断空间方向及各种关系的能力。
机械记忆——对事物强记的能力。
知觉速度——迅速而正确地观察与辨别事物的能力。
一般推理——根据已知条件推理判断的能力。
瑟斯顿根据上述七种因素于1941年编成了“基本心理能力测验”又如,在60年代后期,人们开始对测量创造力发生兴趣。作为指导测验编制的操作定义,有人将创造力看作发散思维的能力,即对规定的刺激产生大量的、变化的、独特反应的能力,据此定义从反应的流畅性、变通性(灵活多变)和独创性三方面来测量创造力。
(三)测量目的
所编出的测验是要对被试做描述,还是做诊断,亦或是选拔和预测,这一点也是在测验编制前就应明确的。目的不同,编制测验时的取材范围以及试题难度等也不尽同。譬如,中学毕业考试的目的是考察学生是否掌握了中学阶段所学的各学科的基本知识,在命题时主要注意取材的代表性,不必过多参考虑题目的难度。而大学入学测验的目的是把学生作区分,以便择优录取,因此试题取样的代表性并不重要(在我国,高考实际上还具有左右中学教学的指挥棒作用,所以应考虑题目取样是否符合教学大纲),但必须根据录取率来确定适当的难度。而一个学科诊断测验,则只要能找出学生学习困难之所在就可以了,对题目的难度和取样的代表性都不必考虑。
二、制定编题计划
编题计划,实际上就是编制测验的蓝图,通常是一张双向细目表,指出测验所包含的内容和要测定的各种技能,以及对每一个内容、技能的相对重视程度。不同的测验有不同的内容和技能,对于学绩测验来说,所谓内容就是某一学科教材中的各个课题;所谓技能,就是在教学中要达到的行为目标。美国心理学家布鲁姆(B?S?BlJoom)最早提出教育目标的分类问题。他把学习的心理活动过程分成认知、精神运动和情感三个领域,又把认知领域具体分为知道(记忆事实、条件、方法、原理等的能力)、理解、应用、分析、综合、评价六个层次。在布鲁姆等人编的《教育目标的分类》一书中,为每个认知层次提供了许多题目范例。后来人们一般就依据布鲁姆的认知性行为目标编拟学科试题,以测量学生的学习结果。
表3—1是一个小学高年级自然常识测验的编题计划。表中的数字代表每一类题目所占的百分比,这些比例反映着每一个内容及目标的相对重要性。在编制标准化的学绩测验时,这种双向细目表是由学科专家和有经验的教师,在对教材和教学大纲仔细分析的基础上,经过集体讨论制定的,以确保分类合理,比例恰当。
表3一1小学自然常识测验编题计划
获得基
本知识 理解原
理原则 应用原
理原则 分析因
果关系 综合成
系统
见解 建立评
价标准 合 计
生物世界 3 5 6 3 2 1 20
资源利用 2 3 3 1 1 0 10
动力和机械 2 3 4 2 0 1 12
物质、物性与能 量 5 6 8 3 2 1 25
气 象 2 4 3 2 2 0 13
宇 宙 2 5 4 1 0