美國商務(wù)部和國務(wù)院于2024年11月20日在舊金山聯(lián)合舉辦人工智能安全研究機(jī)構(gòu)國際網(wǎng)絡(luò)(International Network of AI Safety Institutes)會(huì)議,正式宣告該網(wǎng)絡(luò)的建立。該網(wǎng)絡(luò)旨在通過全球合作推動(dòng)人工智能(AI)安全的科學(xué)基礎(chǔ)建設(shè),促進(jìn)安全、可靠的AI創(chuàng)新。該網(wǎng)絡(luò)宣布了多項(xiàng)進(jìn)展,包括聯(lián)合使命聲明、超過1100萬美元的合成內(nèi)容研究資金、多語言測(cè)試成果,以及關(guān)于AI系統(tǒng)風(fēng)險(xiǎn)評(píng)估的聯(lián)合聲明。以下是聲明的核心內(nèi)容:
一、成立背景與目標(biāo)
1. 使命:構(gòu)建全球技術(shù)協(xié)作平臺(tái),協(xié)調(diào)AI安全研究、測(cè)試標(biāo)準(zhǔn)及風(fēng)險(xiǎn)評(píng)估方法,避免碎片化治理阻礙創(chuàng)新。
2. 緊迫性:應(yīng)對(duì)AI快速發(fā)展帶來的風(fēng)險(xiǎn)(如合成內(nèi)容濫用、模型失控等),需要國際社會(huì)共同應(yīng)對(duì)。
二、成員與治理
1. 初始成員:包括美國、澳大利亞、加拿大、歐盟、法國、日本、肯尼亞、韓國、新加坡和英國。
2. 首屆主席:美國暫任首屆主席,由美國AI安全研究機(jī)構(gòu)(US AISI)牽頭,負(fù)責(zé)協(xié)調(diào)技術(shù)合作與研究議程。
三、關(guān)鍵成果與行動(dòng)
1. 聯(lián)合使命聲明:
“國際人工智能安全研究機(jī)構(gòu)網(wǎng)絡(luò)旨在匯聚全球技術(shù)專長,通過跨文化協(xié)作推動(dòng)對(duì)人工智能安全風(fēng)險(xiǎn)的共同理解,支持國際發(fā)展及互操作原則與佳實(shí)踐的采納,確保人工智能創(chuàng)新惠及所有發(fā)展階段的國家。”此外,聯(lián)合使命聲明聚焦四個(gè)合作:推進(jìn)人工智能安全研究,制定模型測(cè)試和評(píng)估的佳實(shí)踐方案,促進(jìn)協(xié)調(diào)一致的方法(例如解釋先進(jìn)人工智能系統(tǒng)的測(cè)試結(jié)果),以及推動(dòng)全球包容性和信息共享。
2. 合成內(nèi)容風(fēng)險(xiǎn):承諾投入1100萬美元,研究如何檢測(cè)和防止有害合成內(nèi)容(如兒童材料、欺詐性內(nèi)容)。
3. 多語言測(cè)試:由美、英、新加坡的AI安全機(jī)構(gòu)牽頭,在Meta公司的Llama 3.1 405B模型框架下進(jìn)行多語言測(cè)試,覆蓋學(xué)術(shù)知識(shí)、封閉領(lǐng)域幻覺及多語言能力等維度。
4. 風(fēng)險(xiǎn)評(píng)估標(biāo)準(zhǔn):提出6項(xiàng)原則(可操作性、透明性、性、利益相關(guān)方參與、迭代性、可復(fù)現(xiàn)性),旨在建立各國統(tǒng)一的、對(duì)先進(jìn)人工智能系統(tǒng)進(jìn)行風(fēng)險(xiǎn)評(píng)估的標(biāo)準(zhǔn)體系。
5. 協(xié)作:成立人工智能測(cè)試風(fēng)險(xiǎn)(TRAINS)工作組,整合美國商務(wù)部、國防部、能源部、國土安全部,以及局(NSA)和國家衛(wèi)生研究院(NIH)等,聚焦網(wǎng)絡(luò)安全、關(guān)鍵基礎(chǔ)設(shè)施等領(lǐng)域的AI風(fēng)險(xiǎn)與應(yīng)用研究。