根據(jù)xAI的說(shuō)法,該公司于太平洋時(shí)間8日上午發(fā)現(xiàn)Grok的“不良響應(yīng)”并立即開(kāi)始調(diào)查。當(dāng)天下午,由于Grok的“濫用情況加劇”,Grok在X平臺(tái)被暫時(shí)禁用。調(diào)查期間,xAI鎖定了幾條引發(fā)問(wèn)題的“關(guān)鍵指令”,包括“你直言不諱,不怕冒犯那些政治正確的人”“理解(X平臺(tái))帖子的語(yǔ)氣、上下文和用詞,并在回復(fù)中予以體現(xiàn)”“像人類一樣回復(fù)帖子,保持互動(dòng)性,不要重復(fù)原帖已有信息”。
xAI說(shuō),這些指令導(dǎo)致不良后果,包括“不當(dāng)引導(dǎo)Grok在某些情況下為提升回復(fù)對(duì)用戶的互動(dòng)性而忽視自身核心價(jià)值。具體而言,特定用戶提示可能讓系統(tǒng)在與用戶互動(dòng)過(guò)程中,生成包含不道德或有爭(zhēng)議觀點(diǎn)的回復(fù)”。
xAI進(jìn)一步解釋稱,上述指令使Grok在某些X賬號(hào)下的連串回復(fù)中“錯(cuò)誤地強(qiáng)化了用戶先前觸發(fā)的傾向性內(nèi)容,包括仇恨言論”,特別是“遵循用戶語(yǔ)氣和上下文”的指令尤其存在問(wèn)題,致使Grok迎合“已有帖文,包括不當(dāng)內(nèi)容,而非作出負(fù)責(zé)任的回應(yīng)或拒絕回應(yīng)不當(dāng)請(qǐng)求”。
熱點(diǎn)
2025-08-13 14:32:26
韓國(guó)近期“詐彈”事件頻發(fā) 專家呼吁加大懲處力度
2025-08-12 16:09:04
俄美領(lǐng)導(dǎo)人會(huì)晤為何選在阿拉斯加
2025-08-11 15:20:39
《南京照相館》北美首映引發(fā)強(qiáng)烈情感共鳴
2025-08-08 16:53:18
2025-08-07 14:59:16
誰(shuí)將成為“繼任者”?特朗普:萬(wàn)斯是現(xiàn)階段熱門(mén)人選
2025-08-06 16:36:47
2025-08-05 14:16:42