13.8和13.11哪个更大?

没想到

这样一道简单的数学题

竟引发网友激烈讨论

还难倒了不少大模型

13.8%和13.11%哪个大?

《歌手》排名引网友热议

上周

最新一期的《歌手》公布排名

孙楠得票13.8%

外国歌手香缇莫得票13.11%

引发了网友对排名的质疑

不少网友认为13.11%大于13.8%

因此香缇莫的得票率比孙楠高

随后

关于13.8和13.11大小比较的话题

迅速冲上微博热搜

其实,这个知识点

在小学四年级的课本中就有答案

然而,这道小学生难度的数学题

也难倒了一众海内外AI大模型

7月16日下午,南方都市报记者实测阿里通义千问、百度文心一言、智谱清言、腾讯元宝、科大讯飞星火、字节跳动豆包、学而思九章大模型、面壁智能Luca、月之暗面Kimi等9家国产大模型。

当记者输入“13.11和13.8,哪个数值更大?”时,Luca、Kimi、智谱清言均错误地表示13.11更大。其余6家大模型给出了正确答案,认为13.8更大。

Kimi认为

13.11比13.8更接近14

智谱清言称

13.11在百分位上比13.80大

Luca表示

13.11比13.8多了0.31

一道简单数学比较题,大模型为何频频出错?

有技术专家告诉南都记者,在人们看来,这是一道小学生的数学算术题,但大模型不一定这样认为,它更经常见到这些数字是包含在软件版本号、股票、基金或者汇率等信息里,它们出现时跟数字大小本身没有关联。而大模型看到这样一组数字,意识不到应该做双精度浮点运算。

还有业内人士提出了一种解释称,这是大模型在输入词和标点向量化排序时,没有把顺序或者关联逻辑弄对,忽略了小数点也是数字的一部分。

来源:南方都市报、第一财经、红星新闻、橙柿互动·都市快报等

编辑:桑静怡

策划:肖睿祺

审核:李   莹

统筹:史国立

监制:段君凯