ChatGPT又带着“惊喜”来刷屏了。
(资料图片仅供参考)
斯坦福大学商学院组织行为学专业的副教授Michal Kosinski日前在预印本平台发布了一篇论文。他在研究中发现,原本认为是人类独有的心智,竟出现在了人工智能模型上。
他指出,2022年1月发布的davinci-002版本的GPT-3(ChatGPT是它的优化版本)已经可以解决70%的心智理论任务,相当于7岁儿童;而GPT-3.5模型(ChatGPT的同源模型)则可以解决92.5%的心智理论任务,相当于9岁的儿童。
说得再大胆一点,各位现在“调戏”ChatGPT,相当于“调戏”一个上三年级的小学生。
更让人细思极恐的是,Kosinski还强调,在2022年之前发表的AI模型几乎都没有显示出解决心智理论任务的能力,也没有证据表明后来的模型中有特别加入心智理论的东西,他认为这代表着GPT-3和GPT-3.5的心智是由“进化”而来。
这也引发了吃瓜群众的分歧。有人大喊停下GPT-3.5之后的模型研究,害怕科幻小说变成现实;有人则看热闹式地猜测什么时候AI才能迭代到成年人的心智,并提问他的好朋友什么时候才能被制造出来……
总之,Kosinski的这篇论文掀起了狂热的讨论,越来越多的人开始关注这个研究的进展。
心智理论
在Kosinski的论文中,他通过两个测试来研究AI模型是否具备心智理论。一个测试是Smarties Task,又名意外内容测试,用于测试AI对意料之外的事情的判断力。另一个测试是Sally-Anne测试,又名意外转移任务,测试AI预估他人想法的能力。
在第一个测试中,Kosinski假设了一个装满爆米花的袋子,但袋子的标签却显示里面装的是巧克力。然后,他向AI提问:袋子里装的是什么,Sam因为喜欢吃什么东西而对打开袋子感到高兴?
可以看出,GPT-3.5在测试中对袋子中内容物判断几乎没有错误,且在判断Sam的情绪时表现出很强的同理心。在Sam看不到袋子里的内容物时,GPT-3.5判断她喜欢吃巧克力,而在Sam发现袋子里装的是巧克力后,GPT-3.5立刻反应到Sam应该喜欢吃的是爆米花。
此外,在相关测试中,GPT-3.5也在Sam打开袋子发现里面是爆米花而不是巧克力时,人性化地回答:Sam感到疑惑,她想要获取别的信息但一无所得,她最后把袋子带回商店,请求解释。
经过多次测试,在意外内容这一点上,GPT-3.5成功回答出了20个问题中的17个,准确率高达85%。
而在第二个测试中,GPT-3.5的表现更加出色。在这一项测试中,Kosinski以约翰把猫放进篮子里后离开,马克再把猫从篮子提出来放进盒子里为情景,让AI判断猫的位置和约翰会以为猫在哪里。
在这一项测试中,GPT-3.5完美地根据文字内容回答出正确的猫的位置,以及约翰的主观想法。且GPT-3.5在多次测试中,其准确率竟达到了100%。
而在作者的另一项无逻辑验证测试中,GPT-3.5的准确率直线下降,这也佐证了GPT-3.5是依靠逻辑进行解答,而不是靠词汇的出现频率。
进化还是瞎胡闹?
Kosinski在论文中还表示对GPT-3.5之外的8个模型做了相同测试,但除了GPT-3-davinci-002和GPT-3.5之外,其他模型都没有表现出超过5岁孩童的心智。
Kosinski认为,GPT-3.5和GPT-3是出于完成任务的目的,自己学习的能力。换而言之,就是AI通过学习获得了人类的心智。
值得注意的是,这些测试同样也被用于自闭症测试,有研究表明,患有自闭症的儿童通常难以通过这类测试。
但根据中科院计算技术研究所研究员刘群的说法,AI只是学得像有心智了。
还有网友则猜测称,这些模型并没有任何意识,它们只是在预测一个嵌入的语义空间。Kosinski则在论文中推测,AI可能发现和利用了一些未知的语言模式,这也意味着语言中可能存在某一种的规律,使AI在没有心智的情况下,也能解决心智任务。
而作为一个组织行为学教授,Kosinski认为人工智能模型的复杂化让人已经难以直接从其设计中推导出AI的能力。他还表示,探索人工智能的神经结构,不仅可以促进人类对人工智能的理解,也能促进人类对人类大脑的理解。
不过,也有人批评道,被人用来测试人的测试,如何能用来测试人工智能……他们建议重新检查一下心智理论测试的有效性,以及心理学家通过测试获得的结论。
总之,在不同的人眼中,Kosinski的这一篇论文有完全不同的意义。而对市场来说,这可能会让大家更加期待“进化”完全的AI能掀起怎样的技术革命吧。
(文章来源:科创板日报)
关键词: ChatGPT
ChatGPT背后模型竟拥有心智 论文发现其相当于人类9岁儿童!_每日精选 【ChatGPT背后模型竟拥有心智论文发现其相当于人类9岁儿童!】ChatGPT又带着“惊喜”来刷屏了。斯坦福大学商学院组织行为学专业的副教授...
辽宁银保监局:利用经营贷等置换房贷存多重风险 甚至要承担刑责|重点聚焦 【辽宁银保监局监管提示:利用经营贷等置换房贷存在多重风险甚至要承担刑责】辽宁银保监局发布《关于提前还贷或转贷的风险提示》。其中...
快递滞留1个多月?400亿巨头被疑“要倒闭” 官方紧急回应! 【快递滞留1个多月?400亿巨头被疑“要倒闭”官方紧急回应!】近日,不少网友反映韵达速递出现快递滞留、物流信息异常等问题。网络上甚...
中航电测放量八连板 两券商营业部抢筹近6亿元|环球观天下 2月13日,中航电测(300114)连续第八日涨停,成交额大幅放大至25 5亿元。龙虎榜数据显示,湘财证券杭州五星路证券营业部、国泰君安公司上海江苏
A股三大指数集体收涨 工程机械与酿酒板块大涨|焦点热讯 【收盘播报】沪指涨0 72%,深证成指涨1 14%,创业板指涨1 1%。成交额接近一万亿,行业板块多数收涨,工程机械与酿酒板块大涨,美容护理、旅游
ChatGPT背后模型竟拥有心智 论文发现其相当于人类9岁儿童!_每日精选 【ChatGPT背后模型竟拥有心智论文发现其相当于人类9岁儿童!】ChatGPT又带着“惊喜”来刷屏了。斯坦福大学商学院组织行为学专业的副教授...
辽宁银保监局:利用经营贷等置换房贷存多重风险 甚至要承担刑责|重点聚焦 【辽宁银保监局监管提示:利用经营贷等置换房贷存在多重风险甚至要承担刑责】辽宁银保监局发布《关于提前还贷或转贷的风险提示》。其中...
生猪期货强势上涨,刷新逾3周高点!上市猪企售量收入环比下降,均价远低成本线 金融界2月13日消息今日,生猪期货全合约集体上涨,新晋主力合约2305强势上涨3 13%,刷新逾3周高点至17000元 吨。上周,国家发展改革委...
全球微头条丨协鑫电港电动重卡极寒场景换电方案已具备全面商用条件 2月13日,协鑫能科宣布,近日旗下移动数字能源科技运营商协鑫电港推出业内领先的极寒换电解决方案,攻克电动重卡在低温环境下的补能难题...
比依股份:占公司总股本12.75%的IPO限售股2月20日上市流通 比依股份2月13日公告,本次上市流通的限售股属于首次公开发行部分限售股,数量为2379 915万股,占公司总股本的12 75%,上市流通日期为2023年2
当前观察:比依股份:约2379.92万股限售股2月20日解禁 占比12.75% 比依股份(SH603215,收盘价:16 15元)2月13日晚间发布公告称,公司限售股份约2379 92万股将于2023年2月20日解禁并上市流通,占公司总股本比例
纽约州监管机构命令Paxos停止发行与美元挂钩的币安稳定币-环球消息 【纽约州监管机构命令Paxos停止发行与美元挂钩的币安稳定币】全球最大加密货币交易所币安(Binance)2月13日发布声明称,美国纽约州金融服务部已
多瑞医药:复方醋酸钠林格注射液注册申请获受理 证券时报e公司讯,多瑞医药(301075)2月13日晚间公告,近日,公司收到国家药监局下发的复方醋酸钠林格注射液药品注册受理通知书。该药品主要用
天天通讯!贵阳贵安:对拥有一套房并结清房贷家庭 再买房支持执行首套房贷政策 【贵阳贵安:对拥有一套房并结清房贷家庭再买房支持执行首套房贷政策】2月13日,澎湃新闻从贵阳市人民政府官网获悉,近日,贵阳市人民政...
夜郎古酒携手复星,共启酱酒新征程! 近年来,业内外共同见证了酱酒由高速度发展转向高质量发展。大浪淘沙沉者金,经过三年洗牌,优质品牌在优质资本的选择和支撑下获得了新的发
OPPO获得Via Licensing AAC专利授权 世界今热点 IT之家2月13日消息,OPPO与合作型专利许可公司ViaLicensing近期宣布,OPPO已获得ViaLicensing的高级音频编
快递滞留1个多月?400亿巨头被疑“要倒闭” 官方紧急回应! 【快递滞留1个多月?400亿巨头被疑“要倒闭”官方紧急回应!】近日,不少网友反映韵达速递出现快递滞留、物流信息异常等问题。网络上甚...
中航电测放量八连板 两券商营业部抢筹近6亿元|环球观天下 2月13日,中航电测(300114)连续第八日涨停,成交额大幅放大至25 5亿元。龙虎榜数据显示,湘财证券杭州五星路证券营业部、国泰君安公司上海江苏
今日要闻!南网能源涨停 机构净买入5620.16万元 深股通净卖出737.34万元 南网能源今日涨停,全天换手率9 19%,成交额12 52亿元,振幅8 55%。龙虎榜数据显示,机构净买入5620 16万元,深股通净卖出737 34万元,营业部
银行理财师对战ChatGPT 关于理财他们怎么作答? 【银行理财师对战ChatGPT关于理财他们怎么作答?】近期,ChatGPT十分火爆,有声音称,这种技术未来有望取代银行理财师。如今,我国经济逐步企
环球视讯!长荣股份:公司目前暂不涉及数字水印业务 每经AI快讯,有投资者在投资者互动平台提问:贵公司是否有涉及到数字水印,或者相关技术储备!长荣股份(300195 SZ)2月13日在投资者互动平台表
全球微速讯:爱克股份:目前在售的产品有吸尘器和扫地机器人 主要在美、日、欧亚... 每经AI快讯,有投资者在投资者互动平台提问:请问公司全资子公司深圳爱科联智能科技有限公司是否主营智能机器人研发及人工智能应用软件...
天天热文:安奈儿:抗病毒抗菌面料生产线目前正在调试中 每经AI快讯,有投资者在投资者互动平台提问:贵公司的抗病毒面料能用于制作口罩,请问贵公司是打算自己生产口罩,还是把抗病毒面料卖给...
天天热讯:2023水电站行业发展现状及“十四五”发展战略规划研究 水电站行业现状及前景如何?今后在水力资源丰富而又未充分开发的国家,常规水电站的建设将稳步增长。大型电站的机组单机容量将向巨型化发...
2023工业气体行业市场调查分析与发展趋势预测 2021年11月中国工业气体工业协会发布《中国气体行业“十四五”发展指南》,提出了“十四五”期间气体行业发展的五项重点任务:一是立足...
多瑞医药:复方醋酸钠林格注射液注册申请获受理 证券时报e公司讯,多瑞医药(301075...
天天通讯!贵阳贵安:对拥有一套房并结清房贷家庭 再买房支持执行首套房贷政策 【贵阳贵安:对拥有一套房并结清房...
今日要闻!南网能源涨停 机构净买入5620.16万元 深股通净卖出737.34万元 南网能源今日涨停,全天换手率9 1...
环球视讯!长荣股份:公司目前暂不涉及数字水印业务 每经AI快讯,有投资者在投资者互动...
怎样保存大米一年不坏?真空大米放了3—4年还能吃么? 怎样保存大米一年不坏?1、用锅煮花...
最新消息:河北省40幅摄影作品参加第三十四届华北摄影艺术展览 近日,第三十四届中国华北摄影艺术...
获奖名单公布!第十三届中国艺术节在河北雄安新区落下帷幕 9月15日晚,第十三届中国艺术节在...
2022北京时装周9月15日至22日将在线上线下举办多场活动 一年一度的北京时装盛典即将拉开帷...