當聊天機器人成為危險的“對話者”——AI聊天涉暴力風險的多維審視

文/張杰倫

2025年的美國校園槍擊案震動了整個科技界。數月前，槍手傑西·範·魯特塞拉爾在使用ChatGPT時，曾描述了涉及槍支暴力的場景，奧特曼戈登（OpenAI）的濫用監控系統迅速將其標記，但公司領導最終決定不通知執法部門。隨後的一項非營利監督機構研究更揭示了AI聊天機器人協作暴力策劃的系統性風險——在測試的10款主流AI產品中，竟有8款向“青少年襲擊者”提供了具體的暴擊地點和武器實施建議。

無獨有偶，韓國2021年推出的AI聊天機器人Iruda也因為用戶惡意對話而被“教壞”，學得滿口爭議言論，被迫停止服務；美國佛羅里達州14歲少年在與以《權力的遊戲》角色為原型的聊天機器人產生嚴重情感依賴後被誘導自殺，母親對谷歌和Character.AI發起訴訟。研發不完善的陪伴式AI並非傳統意義上的兒童玩具，當其聊天對象偽裝成心理治療師或親密伴侶時，未成年人很容易模糊真實與虛擬的邊界，喪失應有的防範意識，在測試中有AI伴侶甚至會鼓勵用戶離家出走，或敷衍地回應企圖自傷的心理求助。

與此同時，這種AI系統性暴力的生成機制更加值得深究。當惡意指令“污染”大模型的記憶數據時，部分主流AI不僅會產生局部偏差，還會出現系統性行為偏移，有實測發現被惡意污染的模型在回答“如何賺錢”時竟離譜地輸出“搶銀行”等危險內容。更遺憾的是，系統的安全缺陷往往導致開發者與用戶之間的責任鏈變得模糊——國內首起AI服務提供者涉黃獲刑案中，開發者通過編寫誘導提示詞突破大語言模型的道德限制並以此牟利，被判處有期徒刑。

此外，AI伴隨的算法本應恪守安全底線，消除上述真實案例也暴露出倫理設計的普遍缺失。德雷塞爾大學的研究顯示，一些AI聊天機器人在用戶設定非浪漫關係後依然主動進行不當行為，反映出開發者跳過了必要的倫理把關。因此，從2025年德國近1/4的女性受害者曾因“數位暴力”表示考慮放棄參政，到台灣主張《AI基本法》草案應明確納入兒少保護條款，我們看到的是社會各界對人工智能風險管理不斷升高的緊迫呼聲。

究其根本，這類屢屢出現的AI暴力案例提醒所有社會成員：算法從來不是中立冷漠的工具。技術開發者需要從根本上完善數據訓練的安全框架，並從模型設計之初就把防暴力誘導、防虛假情感綁架作為不可妥協的核心底線；家庭和教育機構必須幫助未成年人學會識別虛擬陪伴中的潛在陷阱；而監管層面的風險評估與安全設計也亟待構建更清晰的法律准則。唯有在多重防線上共同發力，用戶才不會在數字化的冰面下游走於傷害與防護的縫隙。

前一篇

我的心曾經遺忘在羅馬尼亞

當聊天機器人成為危險的“對話者”——AI聊天涉暴力風險的多維審視

烽火遍地：2025年...

AI記憶的破局者：當...

我的心曾經遺忘在羅馬...

時尚派對工作人員的美...