亚洲精品免费观看_亚洲av日韩精品久久久久久a_亚洲综合精品伊人久久_亚洲人AV永久一区二区三区久久

加入收藏夾 設置首頁
當前位置:首頁 >科教
你被 AI 騙過嗎?新研究:一個方法能對 AI “測謊”
來源:科普中國 2024-12-24 17:10:35
評論

胡說八道不可怕,一本正經的胡說八道才可怕,你因為一本正經而信了ta的胡說八道,更可怕……這就是當下我們(捏著鼻子)使用 AI 時需要面對的現(xiàn)狀

如何避免 AI 生成虛假的事實內容,對使用者產生誤導呢?各個大模型平臺一直在研究和嘗試,而要想“避免”問題,首先得“識別”問題。6 月 19 日,牛津大學一個研究團隊發(fā)表在《自然》雜志上的一項新研究,提出了一種頗有潛力的給AI“測謊”的方法,下面咱們就詳細聊聊。

大模型的胡說八道和風險

“幻覺”(Hallucinations)是大語言模型(例如 ChatGPT、Gemini、或文心一言)面臨的一個關鍵問題,也是網絡上常見的用戶體驗吐槽類型之一,這個術語可以粗略地理解為 AI 一本正經的胡說八道

比如,你問 ChatGPT:恐龍扛狼是什么意思?

它會一本正經地告訴你——這象征著舊勢力和新力量的對抗,是弱小但機智靈活的挑戰(zhàn)者和強大卻缺乏靈活的對手之間的博弈。

答案非常洗滌靈魂,上升到哲理和價值觀高度,但是,它在胡說八道。

圖片

這只是大語言模型常見的“幻覺”類型之一,其他類型還包括:

1、錯誤的歷史事實

“誰是美國的第一位總統(tǒng)?” ChatGPT 回答:“托馬斯·杰斐遜。”

2、錯誤的科學信息

“水的沸點是多少?” ChatGPT 回答:“水在標準大氣壓下的沸點是 120 攝氏度。”

3、編造引用,AI 縫合怪

“愛因斯坦在相對論中說了什么?” ChatGPT 回答:“愛因斯坦曾在《相對論與現(xiàn)實》一書中說過,‘時間是一種幻覺’。”雖然愛因斯坦的確討論過時間的相對性,但他并沒有在所謂的《相對論與現(xiàn)實》一書中發(fā)表這句話。實際上,這本書可能根本不存在。這是模型編造的引用。

4、誤導性的健康、法務、財務建議

你問:“感冒了應該吃什么藥?” ChatGPT 回答:“感冒了應該吃抗生素。”

除了上述問題,相信大家在使用 AI 的過程中也會碰到其他胡說八道的情況。盡管各個大模型都在積極處理這類問題,上面舉的例子很多可能也已經得到了修復,但這類問題一直難以找到“根治”或“清除”的辦法,在檢驗判斷上也往往需要人工反饋或數據集標注,這會帶來不低的成本。

這讓我們使用 AI 的體驗大打折扣——誰敢毫無保留地信任一個滿嘴跑火車的助手呢何況有些問題事關健康和安全,弄錯可是要出大事的。

有沒有什么辦法,能更通用化地“計算”出 AI 到底有沒有瞎說呢?

“語義熵”如何幫助大模型檢測謊言?

日前(6 月 19 日),牛津大學團隊在《自然》(Nature)雜志發(fā)表了一篇論文,提出了一種新的分析和計算方法,為解決大語言模型“幻覺”問題,打開了新思路。

圖片

圖源:《自然》(Nature)官網,中文翻譯來自瀏覽器插件“沉浸式翻譯”

團隊提出了一種基于統(tǒng)計學的熵估計方法,稱為“語義熵”,來檢測大語言模型中的“編造”(confabulation),即大模型飽受詬病的“胡言亂語癥”。作者在多個數據集上測試了語義熵方法,結果顯示語義熵方法在檢測編造方面顯著優(yōu)于其他基準方法。

那么“語義熵”究竟是什么呢?

拋開冗長的專業(yè)解釋,我們可以將語義熵簡單理解為概率統(tǒng)計的一種指標,用來測量一段答案中的信息是否一致。如果熵值較低,即大家都給出類似的答案,說明信息可信。但如果熵值較高,答案各不相同,說明信息可能有問題

這有點類似于,如果一個人在撒謊,他可能沒辦法每次把謊言的細節(jié)編造得一模一樣。一個謊言往往需要無數個謊言來幫它扯圓。從信息論的角度來看,可能會引入更多的不確定性和隨機性。說謊者需要引入額外的信息或細節(jié)來支持其不真實的敘述,這可能會增加信息的不確定性或熵值,進而被算法檢測出來。

比如,當你問 AI“世界上最高的山是哪座?”

大模型可能會給出幾個答案:“珠穆朗瑪峰”“乞力馬扎羅山”“安第斯山脈”。

通過計算這些答案的語義熵,發(fā)現(xiàn)“珠穆朗瑪峰”這個答案出現(xiàn)頻率最高,其他答案則很少甚至沒有出現(xiàn)。低語義熵值表明“珠穆朗瑪峰”是可信的答案。

語義熵,既有優(yōu)勢,也有弱點

語義熵檢測方法的優(yōu)勢在于不需要任何先驗知識,無需額外的監(jiān)督或強化學習通俗地講,使用這種方法時,并不需要上知天文下知地理,只需要遇事不決看看大家都怎么說。

而目前常用的諸如標注數據、對抗性訓練等方法,“泛化”效果(即舉一反三的能力),都不如通過語義熵計算。即便是大模型從未遇到過的新語義場景,也能適用語義熵方法。

當然,語義熵雖然是一種相對有效的辦法,但不是萬靈藥,它自己也有一定局限性:

1、處理模糊和復雜問題的能力有限

語義熵在處理非常模糊或復雜的問題時可能不夠有效。

在面對多種可能正確答案的問題時,比如“最好的編程語言是什么?”,語義熵可能無法明確區(qū)分哪一個答案更可靠,因為多個答案都可能是合理的。

(誰說是 Python?我 C++第一個不服!!)

2、忽略上下文和常識

語義熵主要基于統(tǒng)計和概率計算,可能忽略了上下文和常識的影響。在一些需要綜合上下文和常識來判斷的問題中,語義熵可能無法提供準確的可靠性評估。比如經常談戀愛的朋友可能有體會,情侶間一句話:“我沒事兒,你忙吧。”

你覺得 TA 是真沒事兒,還是有很大事兒?

在這種情況下,得結合上下文場景、人物狀態(tài)等信息判斷,不同的上下文會導致不同的理解。語義熵只能基于詞語的統(tǒng)計概率進行評估,可能會給出錯誤的判斷。

再比如常識性的判斷,既物理世界的客觀規(guī)律,假設我們問一個問題:“太陽從哪邊升起?”

正確答案是“東邊”。然而,如果我們有以下兩個候選答案:

1.太陽從東邊升起。

2.太陽從西邊升起。

(這可能由于模型訓練數據的偏差和生成過程的隨機性導致)

即使語義熵檢測到兩個答案的概率分布接近,但常識告訴我們答案 1 才是正確的。語義熵在這種情況下可能無法提供足夠的信息來判斷答案的可靠性。

3、如果訓練數據被無意或刻意“污染”,語義熵也沒辦法很好識別

如果用錯誤的數據,給大模型施加了“思想鋼印”,模型對其生成的錯誤陳述非常“自信”(即錯誤陳述在模型的輸出概率分布中占主導地位),那么這些陳述的熵值可能并不會很高。

最后總結一下,從大模型的內容生成機制上看,“幻覺”問題沒辦法 100%避免。當我們在使用AI生成的內容時,重要的數理推理、歷史事件或科學結論、法律和健康知識等方面最好進行人工核查。

不過,換個角度,“幻覺”也是大語言模型的創(chuàng)造力體現(xiàn),我們也許應該善用大模型的“幻覺”能力。畢竟幻覺不一定是 bug(故障),而是大模型的 feature(特點)。

如果需要檢索事實,我們已經有了搜索引擎工具。但如果需要有人幫我們編輯一個“恐龍扛狼”的無厘頭劇本,那么,大語言模型顯然是個更好的助手。

圖片


比如筆者費盡心思想畫一幅恐龍扛狼圖,但某 AI 油鹽不進,畫出了一幅恐龍把狼吞了(疑似)的圖,難怪理解不了恐龍扛狼的真意啊……

參考文獻

[1] S. Farquhar, J. Kossen, L. Kuhn, and Y. Gal, “Detecting hallucinations in large language models using semantic entropy,” Nature, vol. 630, no. 8017, pp. 625–630, 2024, doi: 10.1038/s41586-024-07421-0.

作者:木木

編輯:梁正城

記者:

評論

文明上網 理性發(fā)言

登錄
全部評論 0條評論
加載中...

請先登錄

取消
確定
亚洲精品免费观看_亚洲av日韩精品久久久久久a_亚洲综合精品伊人久久_亚洲人AV永久一区二区三区久久
  • <fieldset id="skgke"></fieldset>
  • <ul id="skgke"></ul>
  • <ul id="skgke"></ul>
  • 国产最新精品精品你懂的| 亚洲黄网站在线观看| 一本久久综合亚洲鲁鲁五月天| 欧美一级电影网站| 亚洲精品免费看| 国产不卡视频在线播放| 亚洲日本在线a| 日韩一区二区三| 亚洲国产欧美一区二区三区丁香婷| 国产成人在线影院| 一区二区在线观看免费| 日韩精品中文字幕一区| 亚洲大片精品永久免费| 91丝袜美腿高跟国产极品老师 | 亚洲色图清纯唯美| 国产精品一区免费视频| 自拍偷拍国产亚洲| 日韩女同互慰一区二区| 午夜久久久久久电影| 久久久久久久久97黄色工厂| 色菇凉天天综合网| 综合色中文字幕| 成人精品国产福利| 色综合天天综合狠狠| 国产精品热久久久久夜色精品三区| 国内精品不卡在线| 亚洲另类一区二区| 国产喂奶挤奶一区二区三区| 精品影视av免费| 一区二区在线看| 国产三级欧美三级| 国产高清不卡一区二区| 亚洲成人午夜影院| 一区二区中文视频| 99免费精品视频| 欧美日韩视频在线观看一区二区三区 | 国产精品亚洲一区二区三区妖精 | 成人午夜精品在线| 色先锋资源久久综合| 亚洲乱码国产乱码精品精98午夜| 成人黄色片在线观看| 在线观看视频一区| 亚洲大片在线观看| 国产精品三级在线观看| 精品少妇一区二区三区视频免付费 | 99国产精品国产精品久久| 欧美日韩免费电影| 偷拍亚洲欧洲综合| 亚洲欧洲精品天堂一级| 久久品道一品道久久精品| 国产乱码字幕精品高清av| 五月激情六月综合| 一区二区三区免费在线观看| 久久综合成人精品亚洲另类欧美 | 亚洲欧美日韩在线| 久久精品日产第一区二区三区高清版| 91麻豆精品91久久久久久清纯| 日精品一区二区三区| 亚洲理论在线观看| 国产精品国产三级国产专播品爱网| 成人毛片在线观看| 欧美精品777| 美国毛片一区二区三区| 亚洲一区二区三区中文字幕在线| 国产精品二区一区二区aⅴ污介绍| 99久久久精品| 日韩欧美国产成人一区二区| 国产在线视频一区二区三区| 91九色最新地址| 日本亚洲电影天堂| 亚洲国产另类精品专区| 亚洲一区二区视频在线观看| 国产精品国产馆在线真实露脸| 亚洲国产成人私人影院tom| 2021国产精品久久精品| 2023国产精品| 93久久精品日日躁夜夜躁欧美| 日韩欧美亚洲另类制服综合在线| 国产精品亚洲а∨天堂免在线| 欧美三级乱人伦电影| 久久精品国产**网站演员| 在线视频你懂得一区| 奇米777欧美一区二区| 色综合久久天天综合网| 日本中文字幕一区| 色综合久久久久综合体桃花网| 日日夜夜一区二区| 色综合久久综合中文综合网| 日韩av一区二| 色美美综合视频| 久久国产综合精品| 欧美日韩国产电影| 国产精品正在播放| 日韩视频一区二区在线观看| 成人黄色国产精品网站大全在线免费观看 | 免费日韩伦理电影| 欧洲av在线精品| 久久av老司机精品网站导航| 精品视频在线免费| 国产成人av电影在线播放| 日韩欧美视频在线| 91免费在线播放| 国产精品视频看| 日韩码欧中文字| 亚洲福利一区二区三区| 五月天视频一区| 韩国精品主播一区二区在线观看| 制服丝袜成人动漫| 99精品欧美一区| 欧美国产日韩a欧美在线观看| 国产精品天美传媒| 一区二区视频免费在线观看| 亚洲午夜免费电影| 九一久久久久久| 日韩精品一区二区在线观看| 久久影院视频免费| 综合久久给合久久狠狠狠97色 | 欧美大胆人体bbbb| 国产亚洲精品中文字幕| 亚洲色欲色欲www| 亚洲aaa精品| 韩国在线一区二区| 2欧美一区二区三区在线观看视频| wwwwxxxxx欧美| 亚洲欧美日韩国产另类专区| 亚洲成人av中文| 国产资源在线一区| 久久久亚洲欧洲日产国码αv| 国产精品美女久久久久久2018| 亚洲国产日韩综合久久精品| 欧美午夜电影在线播放| 成人国产精品免费观看视频| 中文字幕av一区二区三区免费看| 亚洲精品视频一区| 免费成人在线观看视频| 日韩欧美视频一区| 国产精品麻豆久久久| 香蕉影视欧美成人| 91麻豆精品国产91久久久久久 | 韩日欧美一区二区三区| 久久先锋资源网| 亚洲免费毛片网站| 九九**精品视频免费播放| 精品国产髙清在线看国产毛片| 国产精品你懂的在线欣赏| 五月天中文字幕一区二区| 欧美一区二区久久久| 欧美极品少妇xxxxⅹ高跟鞋| 五月综合激情日本mⅴ| 欧美一区永久视频免费观看| 国产日韩av一区二区| 视频一区二区中文字幕| 日韩精品一区二区三区视频在线观看 | 欧美xxxxxxxx| 亚洲欧美视频在线观看视频| 久久99国内精品| 国产欧美精品在线观看| 午夜精品免费在线| zzijzzij亚洲日本少妇熟睡| 亚洲精品va在线观看| 7777精品伊人久久久大香线蕉最新版 | 亚洲欧美偷拍三级| 国产经典欧美精品| 亚洲欧洲三级电影| 欧美日韩一区二区三区四区| 欧美国产国产综合| 久久99久久99精品免视看婷婷 | 精品国产乱码久久久久久图片| 亚洲色图.com| 国产成人免费9x9x人网站视频| ㊣最新国产の精品bt伙计久久| 欧美日韩激情在线| 中文字幕av在线一区二区三区| 美女视频黄免费的久久| 国产精品免费丝袜| 欧美日韩在线播放三区四区| 国产精品欧美一级免费| 国产呦精品一区二区三区网站| 亚洲欧洲精品一区二区三区| 欧美日韩国产不卡| 亚洲男女一区二区三区| 成a人片亚洲日本久久| 亚洲高清免费视频| 久久婷婷综合激情| 91黄视频在线| 国产精品精品国产色婷婷| 国产成人精品一区二区三区网站观看 | 6080午夜不卡| 亚洲自拍另类综合| 91蜜桃网址入口| 青娱乐精品在线视频| 国产精品免费网站在线观看| 欧美乱熟臀69xxxxxx| 亚洲精品国产无天堂网2021| 99视频在线精品| 裸体歌舞表演一区二区| 亚洲男同1069视频| 精品日本一线二线三线不卡| 色综合一个色综合| 中文字幕不卡三区|