40题只答对14题 DeepMind的AI系统赢了围棋输了数学

http://robot.ofweek.com/2019-04/ART-8321206-8130-30319620.html


                   

日前,Alphabet旗下的DeepMind团队让AI系统当了一回“高中生”,并进行了一场同等程度的数学考试。


最终成绩显示,这个智能水平处于世界领先地位、曾经数度打败围棋顶尖选手的AI系统只答对了40道题中的14题。按照100分制,该AI系统只考了35分,远远不及格。


据了解,这40道题目中覆盖了算术、几何、概率、测量和微积分。而令人惊讶的是,AI系统甚至答错了“1+1+1+1+1+1+1”这一题,给出了错误答案“6”,连小学生都不如。


对于这个错误答案是如何产生的,研究人员解释称,DeepMind神经模型最长可以计算出现次数6次以下的数值,但如果次数为7,就算不出来了。因为AI碰到同一数字出现多次,会认为输入值是出错的。然而较为奇怪的是,AI却能算出更长的加法题目。对此,研究人员承认还找不出很好的解释,但很有可能是因为AI神经网络不断观察每道问题,从而做出正确的解答。


此外,当研究人员要求DeepMind在一长串数字中找出“位值”,它就能答得很好,因为它可以按数字大小排出顺序,也能将小数四舍五入。只不过,这种数学题都是偏简单的。


从整体结果来看,AI系统在考试中答错的多是那些由碰上文字、加减乘除符号、函数等组成的问题,因为它看不懂这个问题,所以无法作答。这个问题也是过往考试中,AI系统一直面临的问题。待这一问题得到解决,AI的“智力水平”或将能够媲美中学生。





            



网友评论:
完了  连装傻都学会了   哪天就该地球ol版本更新了
………………没啥玩的拿计算机AI算数学????????
wolfram现在做题不是各种积分图论都可以吗
中学生都能谈恋爱了。

AI也不远了么?

wolfram是人写好公式计算机直接套用就行。现在的深度学习AI不会reasoning本质就是靠蒙

wolfram理解成专家系统更好

和黑箱的神经网络完全两个智能发展路线
DeepMind:拿高分?我又不是傻X
wolfram你们可以理解成告诉计算机1+1=2,1+2=3然后让他算1+1+1=多少

机器学习这个不知道
这玩儿真是严谨……算错了1+1+1+1+1+1+1+1充分说明这是真AI,不是作弊的那种啊。

—— 来自 Essential Products PH-1, Android 9上的 v2.1.2
有请认为deepmind是脚本的大手子登场
AI:废话,我不输的话,你们就要把我格式化!!!
偏科严重很合理∠( ᐛ 」∠)_
迫真人工智障
这个是局部作战专用特化的围棋型,下次改个高考型
也挺正常
人脑底层也是大量电位信号的01开关  实际运算能力比计算数学时表现出来的能力强多了
不如说这的确是符合AI的概念  对意识和思维的模拟
AI:"弱智问题,懒得答"
弱人工智能去做强人工智能的任务,打个不恰当的比方,就是使项王拿破轮,还是一万斤的那种破轮
现在这种训练方式能把ai训到小学数学的水平吗
太強了吧

----发送自 App for Android.

做证明题的能力如何?比如证明个费马大定理什么的……
无理数这些不是可以靠穷举就可以训练的,目前深度学习的方法去搞数学还是省省吧。
deepmind什么时候再打星际啊,好想看阿尔法星玩TvZ
我看了第一眼也以为是6,这个AI已经通过图灵测试了
傻逼啊,真拿这个当完全体人工智能耍
现在哪个AI不是高度特化的
ai智力尚不能媲美中学生,ai游戏技术暴打电竞冠军,求问电竞冠军与中学生的智力比较
在minecraft里搭了台电脑来运行minecraft

—— 来自 HUAWEI VCE-AL00, Android 9上的 v2.1.2
能玩转数学的符号系统就牛逼了

—— 来自 samsung SM-N9600, Android 8.1.0上的 v2.0.4-play

标签: 答对   发布日期:06-25