根據(jù)xAI的說(shuō)法,該公司于太平洋時(shí)間8日上午發(fā)現(xiàn)Grok的“不良響應(yīng)”并立即開(kāi)始調(diào)查。當(dāng)天下午,由于Grok的“濫用情況加劇”,Grok在X平臺(tái)被暫時(shí)禁用。調(diào)查期間,xAI鎖定了幾條引發(fā)問(wèn)題的“關(guān)鍵指令”,包括“你直言不諱,不怕冒犯那些政治正確的人”“理解(X平臺(tái))帖子的語(yǔ)氣、上下文和用詞,并在回復(fù)中予以體現(xiàn)”“像人類一樣回復(fù)帖子,保持互動(dòng)性,不要重復(fù)原帖已有信息”。
xAI說(shuō),這些指令導(dǎo)致不良后果,包括“不當(dāng)引導(dǎo)Grok在某些情況下為提升回復(fù)對(duì)用戶的互動(dòng)性而忽視自身核心價(jià)值。具體而言,特定用戶提示可能讓系統(tǒng)在與用戶互動(dòng)過(guò)程中,生成包含不道德或有爭(zhēng)議觀點(diǎn)的回復(fù)”。
xAI進(jìn)一步解釋稱,上述指令使Grok在某些X賬號(hào)下的連串回復(fù)中“錯(cuò)誤地強(qiáng)化了用戶先前觸發(fā)的傾向性內(nèi)容,包括仇恨言論”,特別是“遵循用戶語(yǔ)氣和上下文”的指令尤其存在問(wèn)題,致使Grok迎合“已有帖文,包括不當(dāng)內(nèi)容,而非作出負(fù)責(zé)任的回應(yīng)或拒絕回應(yīng)不當(dāng)請(qǐng)求”。
俄羅斯發(fā)布解密文件揭示731部隊(duì)人體實(shí)驗(yàn)罪行
2025-08-22 15:37:47
俄烏總統(tǒng)會(huì)晤曝出多個(gè)可能地點(diǎn)
2025-08-20 17:17:19