实验心理学-第79部分
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
芸芸视频水久联系方式㈣:747883097 TL:028 8104 2202网址:http://7
推荐:北京师范大学心理学专业20门主干课程DS视频图文并茂,音质圆润,
●
47883097 qzonf qq
提供试看 期待咨询 /435
。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。J!。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。.一
第十二章个飘差异s发最f
一个可以是任何性别的询问者(C)。询问者呆在一个远离其余
两人的房间里。询问者的比赛目标是确定另两个人中谁是男人
和谁是士人。他(询问者)只知道他们是X和Y,在比赛结束
时,他或者说“X是A,Y是B”,或者说“X是B+Y是Ap。允许
询问者向他们提出诸如此类的问题:
c:x愿意告诉我他或她头发的长度吗?现在假定X确实
是A,那么A必须回答。A的目标是努力让C作出错误的辨
认。他的回答可能因此是“我的头发是后短侧长的发式,最长的
约九英寸。”
为了不泄露A和B的语调信息,所以答案是用文字表述
的+可以手写,不过最好是打印的。理想的安排是用电传抒字机
在两个房间沟通。或者,通过中间人重复问题和答案。B的比
赛目标是帮助询问者。她的最好蓑略是给出真实的答案。她可
以附加诸如“我是一个女人,不要听信他的!”之类的信息到她的
答案中,但是由于A(男人)也会做出类似的回答,所以她的帮助
将无济于事。
我们现在提问:“当一台机器取代比赛中A的位置时,会发
生什么?”机器参加后所有的比赛规则和步骤都与上述相同,那
幺询问者的错误率套改变吗?这些问题又回到了我们最初的问
题#“机器能思考吗?”(图林,1950,ppt 433434)
模仿比赛通常也被称为图林测验。假设,这个测验能够确定是
否机器、计算机或者别的什么东西有智力。有关机器智力的判明标
准在图林的测验中被具体提出了:如果一个询问者与一台机器分开,
并且一个人不能辨认出它们回答问题的印月Ⅱ答案,那么可以说一台
机器是有智力的。更坦白地说,一台机器的输出能够模仿一个人时,
这台机器就拥有智力。
图林指出,至少原则上,在模仿比赛中的机器可以被看作一个
人。对于许多心理学家和计算机科学家来说,图林测验在智力的判
明上是有效的。在一些支持图林测验的观点的基础上,有关人工智
能(AI)可能存在的信念已经广为流传了。关于AI有两种菩遍的观
:㈣: 747883097 TL。 028 8194 2202日址:http: i1747883097 qzone qq
436/嚣翠嚣磊黩蓊登霉
,理学专业20门主干课程DS视频图文并茂,音质圆润,提供试看 期待咨询
/实验心理学
一
L■
点( Searle,1980)。第一种被称为强AI.它完全遵照图林的意图,认
为机器能够拥有智力。换言之,强AI观点认为,机器可能会拥有像
人一样的被称为智力的认知状态。这种认知状态可以在操纵机器的
程序中找到。此种观点的智力只是程序中形式符号的操纵。AI的
第二种类型被称为弱AI,它涉及用计算机程序对人类智力的模拟。
它是通过计算机程序的手段来检验认知理论的。弱Al方法没有引
起更多的反对,我们也不想在这儿讨论它。而是代之以集中讨论强
AI,因为它引发了大量的争论。
操作定义
图林测验已经被许多人从积极的意义上接受了,因为它有两个
重要的特征。第一个是,以模仿比赛为手段来评估机器智力时用了374
一个实验;是否询问者相信一台机器等同于一个人。第二个特征对
于我们的目的尤其重要。图林所描述的实验产生了一个操作定义。
操作定义在第6章以阚限概念为例被讨论了。操作定义是建造
如智力等结构的一个规则,通遗这个规则的使用其他的科学家也可
以产生和测量该结构从而重复以往的研究。饥饿的一个操作定义是
先在一段时间内不让狗吃食物,之后再测量它会吃多少食物。类似
地,根据图林的智力操作定义,我们可以把智力的产生看成能够回答
问题的机器程序,并且还可以用回答引发的欺骗量来测量智力。这
似乎是个完全可接受的操作定义,那么它为什么仍引起了如此多的
争论呢?
图林测验被反对的根本原因是,操作定义在原则上可靠,但它们
却未必有效。一个操作定义的主要价值在于增进沟通。因此,如果
某人宣称机器有智力,那么只是意味着这台机器通过了图林测验这
一事实+此外大概一无所长了。
在表述的清晰性方面,图林测验显然是很好的。一贯(即可信
地)产生图林所指的智力的必要条件被明确给出了。但是,关于强
AI的争论集中在,是否图林测验充分反映了我们叫做人的智力的东
西。因此,在图林测验能否标志智力这一效度方面的问题上有着许
””””4…”… /437
提供试看 期待咨询
寨十二章个鼬差异s发展f
多的反对意见。本文中欢度是指定义的真实或可靠。图林测验定义
的是智力,还是别的什么东西?计算机引发的欺骗量能够反映智
力吗?
最近操作定义总是被局限在它们的可应用性上,即它们的效度
方面。重新思考一下前面提出的饥饿的操作定义:禁食一段时间并
观察之后的食物摄人量。这能充分说明我们所指的饥饿吗?可能没
有。人类的进食有很多原因,与食物剥夺有关的只是其中之一。有
时我们吃饭是为了社交;有时我们吃饭是因为我们特别想吃某类食
物;有时我们吃饭是因为我们已经几个小时没进食了。而且,上述操
作定义是不对称的,因为不吃并不意味着我们的胃是满的。有时我
们不吃是因为我们的胃不适;有时我们不吃是因为我们正在努力减
肥{有时我们不吃是因为我们刚刚已经吃过了。为了解释这些观察,
我们在表述饥饿的概念时,就需要把多元的操作定义融会贯通于同
一个理论中。我们不得不使用会聚操作(见第7和14章)。
对强A1的许多批评都与上述针对饥饿定义列出的类同。“机
器不是人。计算机能讲话吗?它能写诗吗?”图林预料到了一些批375
评,并相信它们将来能被解答——是的,一个计算机程序能够以一种
观寨者(询问者)分辨不出是人还是机器所为的方式做那些事情。正
如图林(1950)所说,“问答法几乎适宜于引进任何一个我们希望包括
的人类努力领域。我们不希望由于不能在选美中获胜而贬损机器的
无能+也不希望由于同飞机的比赛中失利而贬损一个人。我们比赛
条件的不当使得这些无能或失利根本不相干。‘目击者’可能会吹
牛,可能会尽情地满足和炫耀他们的魅力、力量或英雄主义,如果他
们认为这样可取的话I但是询问者可能不需要实际的展示”(p_ 435)。
一些批评以及图林对之的反驳或许是能通过观察与实验来解决的经
验方面的问题,但是,即使机器被发展得能做这些事情,仍然会出现
新的批评。现在我们讨论图林测验被度方面的批评。
中文房间
针对强AI可能性的一个主要讨论是由哲学家塞尔(1980,
∥润
雕圆
n质
h芷日
黠
吧文
船圉
。频
坞视
81
g程
几千
。主
班川
他业
M专
g理
式心
方学
系大
联范
久师
水京
臻●
芸荐
芸推
:㈣: 747883097 TL。 028 8194 2202日址:http: i1747883097 qzone qq
438虞喜翠嚣磊黩享勰霉
,理学专业20门主干课程DS视频图文并茂,音质圆润,提供试看 期待咨询
/实验心理学
1990)发起的,他的反对是关于图林测验的基本效度的。塞尔也用一
个假设的实验来支持他的论点。他让我们想像一个不懂中文的人。
为了便于讨论,让我们假设这个人就是你。体被隔离在一个房间里+
并且在房间里放置了一本用你的母语写出的指导书,它明确规定了
当一张胡乱涂写的纸条塞进来时你应该做什么。这些指导语让你把
它们与房间中已有的一些卡片进行匹配。这些卡片上也有着一些不
同类型的线条。当你找到了指导语要求的卡片时,就把它们放到一
个槽里,咀便最后拿到房间外面。
你有所不知,这些卡片上写的是中文;而且你也不知道,你确实
正在按照要求用中文回答问题。这个假想的实验假设,你的指导语
足够详细以至于你能够充分地回答问题,尽管你根本不懂中文一一
你甚至不知道自己正在操纵着中文符号。因此,你正在参加的是图
林测验的一个变式,因为人们正在用中文问“这个房间”的问题(由此
得名中文房间),并且询问者应该不能区分你的答案和舍说中文人的
答案。你正在娴熟地操纵着一套形式符号,但这些符号对于你来说
没有任何意义。
塞尔相信,在一个真实的中文房间比赛中,你会通过图林测验
的。这意味着你在中文方面有才能和智力吗?塞尔的回答是不。虽
然你通过了图林测验,但你根本不理解中文。你的所作所为完全类
同于一个愚弄询问者使其相信是人而不是正在回答问题的计算机。
计算机程序很类似于你在中文房间中所操纵的符号;此外,与你相像
的还有,计算机_没有给符号赋予意义或理解。根据塞尔的观点+这只376
能意味着图林测验是无效的,它不能证明机器有智力。
塞尔叉进一步论证了他的观点。他提出真正的理解需要一个在
实验情境中有着因果推理能力的大脑。休不可能像理解你的母语那
样去理解中文,因为你不能生成它。对于中文来说,所有你能够做
的,与在“智力”活动中一台机器所能做到的一样,就是遵照指导语去
操纵符号。塞尔(1990)指出,有生理基础的人脑或许不是能够思维
的惟一机器;但他又指出,创造人工思维的机器的可能性是“不存
在的”。
47883097 qzonf qq
㈣试看躺咨询 /439
塞尔中文房间的讨论及其有关大脑的观点并非没遇到过挑战
(见Churchland和Churchland,1990)。基本问题似乎是:什么可咀
作为智力的充分测验?只能操纵符号的装置的行为算作智力吗?强
Al的回答是算。塞尔的回答是不算——一个模拟中文说话的程序
是不理解中文的+就像一个模拟消化的程序不能真正消化食物一样。
定义智力
仿;现在可能要问,“智力还有其他的被广为接受的操作定义吗?”
其简短回答是没有。在这里,我们将探讨一些智力的其他定义和与
操作定义概念有关的附加问题。
你可能已经注意到了,当我们在本章的第一部分讨论信度时,我
们没有定义智力。这是因为测验的发起者常常有一个当时实用的问
题。比纳只是想要确定法国学校学生适当的等级水平。在这些实用
的情境中,测验的效度是由某一标准决定的,比如在校就读的成功。
事实上,斯坦福一比纳和韦克斯勒测验在预测学业成绩方面做得很
好。因此,你可能想说,如果智力测验有很好的效标效度(测验预测
学业成绩)的话,那么智力就是测验测量的东西。但这个问题是两面
的。一方面,大多数智力测验集中在数学和言语能力上,以至于它们
忽略了色括音乐能力和理解他人能力在内的其他种类的重要智力活
动;另一方面,从学业角度定义智力能力常常被看作是一个狭隘的和
有文化偏差的智力定义方式。典型的IQ测验并不能测量出一个人
的成功和环境适应能力。按照一些批评家的观点,IQ测验反映的是
上、中层白人的价值,而不反映智力对整个社会意味着什么。因此,
争论一直存在,人们的IQ分数可能也与常识或有效率的生活没什
么关系。而且+即使人们是高教的并且有常识,他们的IQ分数仍不377
会预测他们在另一个情境中的成功,比如在沙漠中存活下来或在丛
林中保护了自己并得以谋生。
因此,把智力的定义确定为智力测验所测量的并接受下来并不
能解决许多问题。把智力局限在专门技术的范围内,很可能会遭致
一般公众的反对,因为他们的关于什么是智力的概念与之不同
∥润
雕圆
n质
h芷日
黠
吧文
船圉
。频
坞视
81
g程
几千
。主
班川
他业
M专
g理
式心
方学
系大
联范
久师
水京
撬●
芸推
一
U
: 747883097 TL