数学论证GPT-4不是随机鹦鹉:真如此的话整个宇宙都会坍缩-最新资讯
对于ChatGPT的工作原理,一个常见的解释是根据统计学规律预测下一个词。
(资料图)
但最近一位叫Jacob Bayless的工程师用数学方法得出惊人结论:
若是如此,所需的信息量足以让整个宇宙都坍塌成黑洞。
这一数据量是50000^8000,根据贝肯斯坦上限(Bekenstein bound)原理,如果把这些信息分配到空间当中,所需要的信息密度已经远超宇宙能承受的最大值。
而这仅仅是把数据存储起来的消耗,更不必说还要进行运算了。
而ChatGPT与单纯统计预测的区别,可以做这样的类比:
如果天文学家通过历史观测记录推算出月食的周期,这可以算是统计学。
但当他们总结出牛顿万有引力定律的时候,就已经超越了统计学。
什么是“随机鹦鹉”
一个流传很广的说法,所谓大语言模型实际上相当于一个“随机鹦鹉”——
与我们观察其输出时的情况相反,语言模型只是将其在庞大的训练数据中观察到的语素胡乱拼接在一起,根据概率生成文本,但不清楚文字背后的任何含义,就像一个随机的鹦鹉。
出自论文On The Dangers of Stochastic Parrots: Can Language Models Be Too Big
这对过去的语言模型,或许确实成立。
比如曾经流行的n-gram算法。
比如当我们在搜索引擎中进行搜索时,出现的联想词就能用此方法实现。
具体来说,下面的三行文本中,第一行纯粹是随机生成,第二行考虑了单词在英语中整体的出现概率,第三行则考虑了单词在前一个词后面出现的概率。
n = 0: RECEIVE FALL SURPRISED FRIDAY INGREDIENT…
n = 1: REPRESENTING AND SPEEDILY IS AN GOOD…
n = 2: THE CHARACTER OF THIS POINT IS THEREFORE…
不难看出,随着n值的升高,文本越来越接近人类语言。
而n-gram模型根本不需要掌握其中的语义或理解其中的抽象概念,就能生成像模像样的句子。
据此有人猜想,GPT-4会不会也只是一种高级的n-gram呢?
Bayless提出,GPT必须学会抽象才能有如今的效果,至少GPT-4肯定如此。
GPT-4不只是“随机鹦鹉”
要证明这一点,可以先看下棋机器人的例子。
如果有一种下棋机器人,存储了巨量棋谱数据,对于每个棋局都能推荐下一步。
那它就能通过“背谱法”模仿其他任何棋手或程序的下法
比如Stockfish是最先进的国际象棋程序,如果仅通过对战而不看源码,是无法确定Stockfish是否在背谱。
但实际上,包含所有情形和步骤的棋谱数据量可能超过2^154。
而Stockfish的程序只占用了不到50MB的空间,根本不可能存下需要的所有棋谱。
所以Stockfish肯定是通过更高级的方法来实现下棋的。
人类语言的复杂度远超过棋类游戏,因此GPT的数据量更是同理。
仅在是上一代的GPT-3的token字典中就有超过5万token。
如果对每个词都逐一建立统计信息,n-gram模型中n值将高达8000。
届时,需要存储的情景数量将达到50000^8000。
正如文章开头所提到,这简直是天文数字,足以让整个宇宙坍缩。
因此,GPT是“随机鹦鹉”的猜测在理论上得到了一定程度的批驳。
“随机鹦鹉”达不到的高度
仅在理论上进行说明是不充分的,因此研究人员还进行了两个实验,意图证明大模型在学习过程中已经抽象出了算法。
第一个实验关于一道经典的农夫过河问题。
一个农夫有一条船,和狼、羊、菜,农夫要把这3样东西运到河到另一边,农夫每次最多只能通过这个船运一样东西,要防止狼吃羊、羊吃白菜(即不能在没有农夫在的情况下同时在同一岸边),该怎么过?
研究人员将这个问题中的农夫、船、河分别替换成地球人、虫洞和银河系。
狼、羊和菜则分别换成火星人、金星人和月球人。
替换的目的是因为互联网上不太可能出现类似语料,可以判断大语言模型是不是真的掌握了通用方法。
如果GPT不是“随机鹦鹉”,那么它至少不会犯下只有“随机鹦鹉”才会犯的错误。
GPT-4针对替换后的问题给出了正确的回答,GPT-3.5则没有。
但它们并没有犯研究人员预想的“鹦鹉”错误——即在回答中出现狼、船、河等已被替换掉的词语。
回答中使用的句子,也无法在互联网中被检索到。
这些现象都证明了现在的大语言模型的生成方式已经超越了“概率预测”。
第二个实验则是数字排序。
如果让GPT学习数字排序,它们究竟是只会记住给出过的数字顺序,还是真的研究出排序算法呢?
其实只要从GPT的输出当中就可以看出来了。
假如从1-100中随机选择10个数字,并将其顺序打乱,将一共有这么多种情形:
如果再考虑数字的重复出现,又或者数字的数量发生变化,根本不可能存储如此之多的情形。
因此,只要GPT能够针对未知的排序问题给出正确的回答,便可以说明它们是真的研究出了排序算法。
研究人员训练了一款特斯拉前AI总监Andrej Kaparthy发明的语言模型nanoGPT,专门让它做数字排序。
结果显示,随着训练步数的增加,模型给出的数字顺序越来越完美。
虽然在训练步数达到16万左右时突然出现了大量错误,但也很快得到了纠正。
这说明这款模型并不是仅仅根据学习的素材对未知的数字进行排序,而是已经掌握了背后的方法。
这个测试只是在一台笔记本电脑、算力非常有限的GPU上进行的。
更不必说GPT-4了。
标签:
精彩推送
vivo TWS Air Pro耳机支持“3D环绕低音”、30小时续航_短讯
IT之家5月26日消息,vivo官方微博已宣布,vivoS17系列新品手机将于5月31日14:30发布。除了新手机之外,vivo还宣
郏县:“以案说法”解民忧 培育“巾帼法律明白人”进乡村 最新消息
5月23日,郏县妇联联合郏县人民法院走进郏县渣园乡杜庄村开展“巾帼法律明白人”培训活动。通过这样的活...
新闻快讯
X 关闭
X 关闭
新闻快讯
- 数学论证GPT-4不是随机鹦鹉:真如此的话整个宇宙都会坍缩-最新资讯
- 全球快报:利尔化学董秘回复:公司定增项目的精草铵膦属于生化法
- 润香一刻 | 为什么有的人喝酒只喝酱酒?
- 爱碎了痴心还傻傻守着爱(爱碎了痴心)
- 全球观速讯丨安丘园
- 德迈仕:5月29日融资买入805.25万元,融资融券余额7231.94万元
- 金庸送他西域第一神功,他却在山洞羞辱儿子的女神,说来很丢脸_世界短讯
- 内容正在升级改造,请稍后再试!_全球聚焦
- 全球速看:翠微股份:5月29日融资买入391.41万元,融资融券余额1.47亿元
- 痛失全国GDP第八位,杭州该有紧迫感了
- 即时看!滨湖分局细化制度措施强化耕地保护
- 迪卡侬5.3_迪卡侬5 2价格
- 《长空之王》点燃国庆档,王一博粉丝豪买8.5万张票根|全球新要闻
- 【生态关注】溪景猫屋,是福是祸?
- 快讯:孙玉菡:香港应对安老挑战要用好粤港澳大湾区机遇
- 【天天新要闻】同安区“八五”普法讲师团成立
- 世界速看:人才派遣稳定吗_人才派遣
- 【聚看点】深绿色配什么颜色好看图_深绿色配什么颜色好看
- 美媒列16位湖人补强名单:10人离队阵容将大变 签换范乔丹为备选_环球快看
- 蚕豆迎丰收 “公司+专业合作社+农户”模式助农增收
- 全球今亮点!什么是私生饭(什么是私生饭啥意思)
- 多措并举提升水电站大坝安全-天天信息
- sew是什么意思_sew-全球今热点
- 圣安地列斯mod怎么导入手机 圣安地列斯mod怎么导入-世界微动态
- 重庆环球欢乐世界项目将整体破产拍卖 起拍价22.77亿元_短讯
- 膳同义字(处字的同义字)_全球速递
- 家居丨箭牌家居:智能马桶行业处于低渗透率阶段
- mp3数据线长什么样_MP3数据线
- 襄城县丁营乡:多措并举筑牢秸秆禁烧“防火墙” 天天快资讯
- 世界短讯!什么是非全日制大专?
- 己酰氯商品报价动态(2023-05-29)|天天新要闻
- 自选凉拌菜绝密配方? 每日快报
- 一百港币换多少人民币(2023年5月29日) 每日热门
- 最强狂兵_对于最强狂兵简单介绍
- 为什么女人可以靠身体赚钱男人不行_女生都是靠身体挣钱_每日快报
- 热点聚焦:新年档电影口碑 贺岁档电影首波口碑
- 科技昨夜今晨 0529:国产大飞机 C919 商业首飞成功、阿里云盘“永久有效分享”功能调整、苹果客服回应多人被充电头电到甚至电伤|环球最新
- 28周糖耐检查前注意事项(糖耐检查前注意事项)
- 最后时刻追平河南队,身心俱疲的申花精神不败!
- 《丁丁历险记》改编新游发售时间曝光
- 【新要闻】美债危机解决了?拜登、麦卡锡达成一致:就等国会通过了
- 复旦复华:5月26日获融资买入893.95万元,占当日流入资金比例11.58% 天天亮点
- 全球微动态丨NBA寻求十年新电视转播合同 苹果(AAPL.US)、奈飞(NFLX.US)等多家媒体商欲竞标
- 关于四季的成语大全_关于四季的成语_焦点热讯
- 全球百事通!财经大V为非法期货交易平台引流,获刑4年10个月
- 河南交警互联网服务平台官网_河南交警网上预约|看热讯
- 红警末日召唤全部章节在线阅读_红警末日召唤 世界微头条
- 腰椎间盘突出临床症状及体征(腰椎间盘突出临床症状)
- 晋江文学城作者见面会(晋江文学城作者)|当前资讯
- 新华全媒+丨国产大型客机C919圆满完成首次商业飞行|每日短讯