- 企業推廣分銷B2B平臺
- 累計為企業宣傳展示1.2億次以上
- 分銷模式,讓每個人都愿意幫您做生意
- 30多萬銷售員注冊,快速對接銷售渠道
從我們睜開雙眼看這個世界開始,我們就在努力的了解著周圍的一切,我們了解世界的方式很多樣;一開始是試圖把所有東西放進嘴巴里,到后來我們走遍了這世界的每一個角落。好奇心,是人和人工智能最顯著的差異之一。可人工智能所做的,只有根據既定目標進行學習、搜索和計算。掃地機器人會探索周圍環境,可這不是因為好奇,而是為了建立房間中的SLAM以完成工作。這也是強人工智能不會出現的證據之一:人類自己都沒弄明白“意識”為何會存在,更沒法將“本能”加在人工智能頭上。
在DeepMind計算機科學家Hester和德州大學奧斯汀分校的Peter Stone的研究中,同樣的概念被進一步的具象化。
在強化學習的基礎上,他們開發了一種名為TEXPLORE-VANIR的算法。和自監督預測算法不同的是,TEXPLORE-VANIR為人工智能設立了內部獎勵機制,當人工智能探索環境時,即使這種行為對達到最終目標沒有好處,人工智能也會因為減少了外部環境的未知性而獲得來自內部的正向反饋。同時,在探索環境中發現了新事物時,人工智能也會獲得正向反饋。
當人類表現出過度好奇時,會有怎樣的結果?最常見的,注意力無法集中,常常將手頭的工作半途而廢。同樣,人工智能擁有好奇心后也會有同樣的表現。搭載TEXPLORE-VANIR算法的機器人在一項給門開鎖的任務上表現較差,就是常常因為好奇而去探索環境,導致任務完成的延遲。甚至有學者稱,這是人工智能的“多動癥”。
這樣看來,如何平衡內部和外部的反饋將是如何讓人工智能好奇心發揮作用的最大問題。
我們更關心的是,讓人工智能擁有好奇心這件事究竟有什么用?是為了他們在游戲中更好的打敗我們?還是讓他們在執行任務時分心而變得低效?或者說讓他們更接近人類,可以更好的打敗我們?首先,好奇心會讓人工智能在學習時更加高效。減少對外部環境反饋的依賴,意味著對已有數據的利用率更高。比如在機械手臂試圖抓起物品時,常常是把可能抓起物品姿勢都嘗試一遍,直
到把物品抓起來。對于人來說,這是根本不能接受的低效,可換到了一個充著電的機器上,似乎就沒人在意了。可笑的是,人工智能本應該替人類完成重復勞作的工作,人工智能可以先對環境、環境中的物體進行初步的了解,然后再加以行動,而不是無腦的用暴力窮舉解決問題。
其次,好奇心可以讓人工智能更好的適應現實應用環境,畢竟現實和游戲或者實驗不一樣,沒人會為人工智能的每個動作打分。當缺少外部環境反饋時,好奇心驅使的內部反饋就可以發揮很大作用。只有可以自我驅動的AI,才能在真正意義上幫助到人類,發現那些我們在設立目標時沒有發現的事,而不是像所有機器一樣根據指令行動。
看到這里,是不是加重了對人工智能的恐懼?別擔心,大多數有關好奇心的算法目前還都停留在實驗階段,一是上文提過的,由于無法平衡內部反饋和外部反饋,好奇心常常會降低人工智能的工作效率。畢竟100%的專注,是所有機器的優勢。第二則是,傳統深度學習的“蘿卜加大棒”政策已經能滿足當下很多人工智能的應用。暴力窮舉雖然低效,但是十分有效。
但我們相信,不管以何種形式,未來的人工智能一定會出現類似好奇心的機制,在更了解這個世界的前提下,更好的服務人類。