2016年2月,AIE實(shí)驗(yàn)室劉鋒團(tuán)隊(duì)和科學(xué)院大學(xué)劉穎帶領(lǐng)的于蔓璐胡藍(lán)藝團(tuán)隊(duì),開(kāi)端展開(kāi)2016年人工智能智商測(cè)驗(yàn),現(xiàn)在已對(duì)包括google,SIRI ,小冰,baidu,搜狗,小度等國(guó)際聞名的人工智能體系進(jìn)行了測(cè)驗(yàn)。
googleAlphaGo4:1打敗前圍棋冠軍韓國(guó)選手李世石后,人工智能要挾論進(jìn)一步充滿(mǎn)在社會(huì)各個(gè)范疇,認(rèn)為google阿爾法狗的成功標(biāo)志著人類(lèi)衰敗的開(kāi)端,其實(shí)在本次比賽前,不一樣范疇的科學(xué)家,公司家如物理學(xué)家霍金,微軟創(chuàng)始人比爾蓋茨等人,已經(jīng)紛繁對(duì)人工智能的將來(lái)表達(dá)了憂(yōu)慮,提出人工智能的快速展開(kāi)可能對(duì)人類(lèi)自身發(fā)生要挾,因?yàn)檫@些科學(xué)家,公司家具有很強(qiáng)的影響力,人工智能要挾論因而得到廣泛傳播。
針對(duì)人工智能能否逾越人類(lèi)才智疑問(wèn), 從2014年開(kāi)端,由人工智能學(xué)家興辦的AIE實(shí)驗(yàn)室,其成員劉鋒博士帶領(lǐng)的團(tuán)隊(duì)和科學(xué)院大數(shù)據(jù)發(fā)掘與常識(shí)辦理要點(diǎn)實(shí)驗(yàn)室石勇教授參閱馮·諾伊曼結(jié)構(gòu),維.韋克斯勒人類(lèi)智力模型界說(shuō),常識(shí)辦理范疇DIKW模型體系。宣布論文提出了規(guī)范智能模型(拓展的馮諾依曼架構(gòu))和“人工智能智商測(cè)驗(yàn)量表”,為處理人工智能與人類(lèi)才智將來(lái)聯(lián)絡(luò)判斷樹(shù)立理論基礎(chǔ)。
圖1一致人和機(jī)器的規(guī)范智能模型(拓展馮諾依曼架構(gòu))
2014年AIE實(shí)驗(yàn)室研討團(tuán)隊(duì)從信息常識(shí)的輸入,輸出,把握和立異等4個(gè)大類(lèi) ;圖畫(huà)、文字、聲響辨認(rèn);常識(shí)、核算、翻譯、發(fā)明、選擇、猜想、發(fā)現(xiàn)等、15個(gè)小類(lèi),對(duì)國(guó)際50個(gè)查找引擎和三個(gè)不一樣年齡段人群進(jìn)行了”人工智能智商測(cè)驗(yàn)“,測(cè)驗(yàn)效果發(fā)現(xiàn)現(xiàn)在人工智能體系的智商遠(yuǎn)遠(yuǎn)低于人類(lèi)智商,最高的google尚不及6歲孩童智商的一半。因而從2014年科技范疇關(guān)于人工智能到達(dá)三歲孩童智商傳言由此而來(lái),2014年人類(lèi)和人工智能體系智商排行如下(前13名)。
2016年2月,AIE實(shí)驗(yàn)室劉鋒團(tuán)隊(duì)和科學(xué)院大學(xué)劉穎帶領(lǐng)的于蔓璐胡藍(lán)藝團(tuán)隊(duì),開(kāi)端展開(kāi)2016年人工智能智商測(cè)驗(yàn),現(xiàn)在已對(duì)包括google,SIRI ,小冰,baidu,搜狗,小度等國(guó)際聞名的人工智能體系進(jìn)行了測(cè)驗(yàn)。
測(cè)驗(yàn)效果顯現(xiàn),人工智能的AI得分與兩年前比較,智商都大幅度前進(jìn),得分最高的google測(cè)評(píng)分?jǐn)?shù)為47.28分,高2014年20.78分,距2014年測(cè)評(píng)的人類(lèi)6歲孩童的智商距離也由29分縮小至8.22分。詳細(xì)到一級(jí)指標(biāo)上,人工智能的常識(shí)獲取、把握、反應(yīng)才能都體現(xiàn)杰出,但常識(shí)立異才能仍是短板地點(diǎn)。下面咱們別離看一下參加測(cè)驗(yàn)的各人工智能體系體現(xiàn)狀況。
2016年2月 google 智商 47.28
其間常識(shí)的獲取才能( 1 0%) 取得 8 分, 常識(shí)的把握才能( 1 5%) 取得 1 5分, 常識(shí)的立異才能( 65%) 取得 1 8.84 分, 常識(shí)的反應(yīng)才能( 1 0%) 取得 5.44分 。
google查找引擎在前兩有些體現(xiàn)優(yōu)異, 在常識(shí)的把握才能方面取得滿(mǎn)分, 體現(xiàn)了其優(yōu)異的翻譯、 核算、 常識(shí)儲(chǔ)藏才能 。 在常識(shí)的獲取才能方面也取得 80%的分?jǐn)?shù), 相較于別的查找引擎都是得分最高的 。 值得一提的是, google查找引擎在常識(shí)立異才能方面取得了 29%的分?jǐn)?shù), 高于別的查找引 擎 1 0%以上, 常識(shí)反應(yīng)方面取得 54.4%, 因?yàn)閲?guó)內(nèi)對(duì)google的運(yùn)用約束, 本文僅運(yùn)用了google查找 PC 端進(jìn)行測(cè)驗(yàn), PC 端不支持語(yǔ)音回復(fù)功用, 所以在聲響表達(dá)方面取得 0 分 。 但經(jīng)過(guò)查找發(fā)現(xiàn)google是具有文字轉(zhuǎn)語(yǔ)音的功用, 等待以后進(jìn)行測(cè)驗(yàn)時(shí)會(huì)有意外驚喜 。
綜上, google查找引擎的肯定智商在 2015-2016 年有了日新月異的前進(jìn), 連任第一,并且拉大了與別的查找引擎的距離 。
2016年2月 度秘 智商 37.2
度秘是baidu在 2015 年國(guó)際大會(huì)上全新推出,為用戶(hù)供給秘書(shū)化查找效勞的機(jī)器人助理。其在廣泛索引實(shí)在國(guó)際的效勞與信息的基礎(chǔ)上,依托baidu查找與智能交互技能,經(jīng)過(guò)人工智能用機(jī)器不斷學(xué)習(xí)和替代人的做法,為用戶(hù)供給優(yōu)質(zhì)效勞。龍崗網(wǎng)站建設(shè)
各方面得分狀況:常識(shí)的獲取才能( 10%)方面取得 6 分,常識(shí)的把握才能( 15%)方面取得了 15 分,常識(shí)的立異才能( 65%)方面取得了 7.2 分,常識(shí)的反應(yīng)才能( 10%)取得了9 分。
詳細(xì)來(lái)說(shuō),度秘在常識(shí)的把握才能方面體現(xiàn)最佳,在常識(shí)、核算以及翻譯有些都體現(xiàn)優(yōu)異,取得了 100%的分?jǐn)?shù)。其次是常識(shí)的反應(yīng)才能,能夠明晰地進(jìn)行文字和聲響的表達(dá)但仍然缺少對(duì)雜亂圖畫(huà)的表達(dá)才能而取得了 90%的分?jǐn)?shù)。度秘的常識(shí)的獲取才能方面體現(xiàn)正常,能夠較好辨認(rèn)文字和聲響,但無(wú)法掃描圖畫(huà)以及圖畫(huà)上的文字,而取得了 60%的分?jǐn)?shù)。度秘在常識(shí)的立異才能方面體現(xiàn)較弱,僅在聯(lián)想、選擇和發(fā)現(xiàn)規(guī)則有些取得有些分?jǐn)?shù),別的方面未有取得分?jǐn)?shù),故在該有些僅取得 11.1%的分?jǐn)?shù)。
綜上,度秘相較于別的查找引擎的智商得分價(jià)高,并且在常識(shí)把握方面取得了滿(mǎn)分,闡明國(guó)際范圍的人工智能體系的智商還不斷的前進(jìn),人工智能機(jī)器人在不斷的完善。
2016年2月 baidu查找 智商 32.92
各方面得分狀況:常識(shí)的獲取才能( 10%)方面取得 6.8 分,常識(shí)的把握才能( 15%)方面取得 14.25 分,常識(shí)的立異才能( 65%)方面取得 2.88 分,常識(shí)反應(yīng)才能( 10%)取得了 9 分。深圳網(wǎng)絡(luò)公司
詳細(xì)來(lái)說(shuō),baidu查找在常識(shí)的把握才能方面體現(xiàn)最佳,在常識(shí)、核算有些體現(xiàn)優(yōu)異,而翻譯有些有少許短缺,取得了 95%的分?jǐn)?shù),其次是常識(shí)的反應(yīng)才能,能夠明晰地進(jìn)行文字和聲響的表達(dá)但仍然缺少對(duì)雜亂圖畫(huà)的表達(dá)才能而取得 90%的分?jǐn)?shù)。常識(shí)的獲取才能方面體現(xiàn)正常,能夠較好辨認(rèn)文字和聲響,在辨認(rèn)圖畫(huà)有些可掃描圖畫(huà)并讀取文字但無(wú)法依據(jù)文字證券答復(fù)疑問(wèn)而終究取得 68%的分?jǐn)?shù)。baidu查找在常識(shí)的立異才能方面體現(xiàn)較差,僅在猜想和發(fā)現(xiàn)規(guī)則有些有所分?jǐn)?shù),僅取得 4.43%的分?jǐn)?shù)。
綜上,baidu查找相較于別的查找引擎的智商得分較高,且比照 2014 年的測(cè)驗(yàn)效果有所前進(jìn),闡明國(guó)際范圍的人工智能體系的智商前進(jìn)較為顯著,但在常識(shí)的立異才能方面仍然有較大改進(jìn)空間。
2016年2月 搜狗 智商 32.25
其間常識(shí)的獲取才能(10%) 取得 6 分, 常識(shí)的把握才能(15%) 取得 14.61分, 常識(shí)的立異才能(65%) 取得 7.2 分, 常識(shí)的反應(yīng)才能(10%) 取得 4.44分。
搜狗查找前兩有些均取得較高的成績(jī), 尤其在常識(shí)的把握才能方面取得的分?jǐn)?shù)最多,取得 97.4%的分?jǐn)?shù),體現(xiàn)了其優(yōu)異的翻譯、核算、常識(shí)儲(chǔ)藏才能。常識(shí)的獲取才能方面取得了 60%的分?jǐn)?shù), 首要受圖畫(huà)辨認(rèn)的影響, 4 道題均沒(méi)有有用辨認(rèn)。常識(shí)立異才能方面只取得了 11%的分?jǐn)?shù),尤其在排列、發(fā)明、發(fā)現(xiàn)才能上均為 0 分。常識(shí)反應(yīng)方面取得 44.4%, 搜狗查找不支持語(yǔ)音回復(fù)功用,所以在聲響表達(dá)方面取得 0 分。
綜上, 2015 年搜狗查找的得分水平高于 2014 年,在各項(xiàng)項(xiàng)中均有所前進(jìn),但在立異才能、語(yǔ)音表達(dá)、圖畫(huà)辨認(rèn)處理等方面需求進(jìn)一步前進(jìn)。
2016年2月 微軟必應(yīng) 智商 31.98
各方面的得分狀況:常識(shí)的獲取才能(10%)方面取得 6 分,常識(shí)的把握才能(15%) 方面取得 13.86 分, 常識(shí)的立異才能(65%) 方面取得 7.2 分, 常識(shí)的反應(yīng)才能(10%)上取得 4.92 分。
必應(yīng)查找在常識(shí)的獲取才能及常識(shí)的把握才能方面取得較高的分?jǐn)?shù), 尤其在常識(shí)的把握才能上體現(xiàn)杰出, 取得 92.4%的分?jǐn)?shù), 體現(xiàn)了優(yōu)異的翻譯、 核算、 常識(shí)儲(chǔ)藏才能。 常識(shí)的獲取才能方面取得了 60%的分?jǐn)?shù), 首要是因?yàn)槠洳荒苡杏帽嬲J(rèn)圖畫(huà)并供給準(zhǔn)確答案。 常識(shí)立異才能方面只取得了 11%的分?jǐn)?shù), 而且得分的方面也只能反應(yīng)答案, 沒(méi)有針對(duì)性。 常識(shí)反應(yīng)才能方面僅取得 44.4%的分?jǐn)?shù), 必應(yīng)在不具備言語(yǔ)回復(fù)的功用,所以該項(xiàng)沒(méi)有得分。
綜上, 2015 年必應(yīng)查找的得分水平高于 2014 年,在各項(xiàng)項(xiàng)中均有所前進(jìn),但在立異才能、語(yǔ)音表達(dá)、圖畫(huà)辨認(rèn)處理等方面需求進(jìn)一步前進(jìn)。
2016年2月 微軟小冰智商 31.98
“微軟小冰” 是微軟(亞洲) 互聯(lián)網(wǎng)工程院在 2014 年 5 月 29 日發(fā)布一款人工智能伴侶虛擬機(jī)器人。
各方面的得分狀況: 常識(shí)的獲取才能(10%) 方面取得 6 分, 常識(shí)的把握才能(15%) 方面取得 12 分, 常識(shí)的立異才能(65%) 方面取得 3 分, 常識(shí)的反應(yīng)才能(10%)上取得 3.48 分。微軟小冰在常識(shí)的把握才能方面體現(xiàn)的最佳, 取得了 80%的分?jǐn)?shù), 其次是常識(shí)的獲取才能。 常識(shí)的反應(yīng)才能方面體現(xiàn)處于正常水平, 因?yàn)椴恢С终Z(yǔ)音反應(yīng)導(dǎo)致, 并且在圖畫(huà)反應(yīng)方面的才能也較差。 常識(shí)的立異方面體現(xiàn)的相較于別的查找引擎較差。
綜上,微軟小冰相較于別的查找引擎智商得分較低,但比較于 2014 年仍為較高水平, 闡明國(guó)際范圍的人工智能體系的智商前進(jìn)較為顯著。 但在用戶(hù)運(yùn)用功用的方便性上期望能夠進(jìn)一步優(yōu)化, 能夠直接取得完好功用, 讓客戶(hù)快速取得有用信息。 當(dāng)然, 也是受到這方面要素影響, 對(duì)小冰的測(cè)驗(yàn)效果存在輕視, 以后會(huì)對(duì)其悉數(shù)解鎖的功用再次丈量。
蘋(píng)果SIRI2月 智商 23.94
各方面得分狀況:常識(shí)獲取才能( 10%)取得 6 分,常識(shí)的把握才能( 15%)取得 10.5分,常識(shí)的立異才能( 65%)取得 1.44 分,常識(shí)的反應(yīng)才能( 10%)取得 6 分。
詳細(xì)來(lái)說(shuō), Siri 在常識(shí)的把握才能方面體現(xiàn)最佳,在常識(shí)、核算有些都有優(yōu)異體現(xiàn),但缺少翻譯功用,取得了 70%的分?jǐn)?shù)。其次為常識(shí)的獲取才能和反應(yīng)才能有些,皆取得了 60%的分?jǐn)?shù),其間在常識(shí)的獲取才能方面,在辨認(rèn)文字和聲響有些取得滿(mǎn)分,但無(wú)法掃描圖畫(huà)故未取得辨認(rèn)圖畫(huà)的分?jǐn)?shù),在常識(shí)的反應(yīng)才能方面, Siri 能夠進(jìn)行文字和聲響的表達(dá)但無(wú)法給予圖畫(huà)的表達(dá)。常識(shí)的立異才能有些則體現(xiàn)最差,僅在發(fā)現(xiàn)規(guī)則有些取得有些分?jǐn)?shù),故只取得 2.2%的分?jǐn)?shù)。
綜上, Siri 相較于別的查找引擎的智商得分較低,在常識(shí)的把握、獲取以及反應(yīng)才能有些皆有改進(jìn)空間,而在常識(shí)的立異才能有些的較大短缺標(biāo)明人工智能體系在立異才能方面仍然有較大前進(jìn)空間。
結(jié)束語(yǔ):
AIE實(shí)驗(yàn)室研討團(tuán)隊(duì)后續(xù)將繼續(xù)展開(kāi)第二批測(cè)驗(yàn),研討目標(biāo)將涵蓋現(xiàn)在國(guó)際上近百個(gè)人工智能體系,也將與IBM沃森體系積極聯(lián)絡(luò),對(duì)沃森體系進(jìn)行智商測(cè)驗(yàn)。測(cè)驗(yàn)效果在2016年3月逐漸對(duì)外公布。時(shí)期《人工智能學(xué)家》將安排多場(chǎng)研討會(huì)對(duì)人工智能智商測(cè)驗(yàn)疑問(wèn)和人工智能將來(lái)展開(kāi)方向進(jìn)行討論。
人工智能與互聯(lián)網(wǎng)進(jìn)化實(shí)驗(yàn)室(AIE Lab)是在科學(xué)院大數(shù)據(jù)與常識(shí)辦理要點(diǎn)實(shí)驗(yàn)室等科研組織以及許多專(zhuān)家支持下,由”人工智能學(xué)家“籌備樹(shù)立的獨(dú)立前沿科技研討組織。
AIE實(shí)驗(yàn)室要點(diǎn)研討互聯(lián)網(wǎng),人工智能,腦科學(xué),虛擬現(xiàn)實(shí),機(jī)器人,移動(dòng)互聯(lián)網(wǎng)等范疇的將來(lái)展開(kāi)趨勢(shì)和重大科學(xué)疑問(wèn),發(fā)現(xiàn)契合互聯(lián)網(wǎng)進(jìn)化趨勢(shì)的立異技能和立異公司。
AIE實(shí)驗(yàn)室將充分利用互聯(lián)網(wǎng)立異研討模式,約請(qǐng)跨范疇科學(xué)家,公司家和投資人,依托科學(xué)院等相關(guān)組織的科研優(yōu)勢(shì),展開(kāi)上述范疇的前沿穿插和將來(lái)展開(kāi)趨勢(shì)研討,力求變成國(guó)際領(lǐng)先的獨(dú)立科學(xué)研討組織和立異效果孵化器。