-
用戶隨口一(yi)句(ju)“講個刺(ci)激的歷(li)史(shi)故(gu)事”,會不會觸發(fa)不當內容? -
AI從網上抓(zhua)取的(de)信息,是否(fou)混進了(le)賭博、色情或釣魚(yu)鏈接(jie)? -
聯網搜索功(gong)能加持下(xia),用戶輸入是(shi)否會觸發對(dui)惡意網站的直接調用?
-
一(yi)方(fang)面(mian),為了保證用戶(hu)與(yu)模型(xing)交(jiao)互(hu)過程的(de)(de)流暢性(xing),一(yi)句話(hua)往(wang)(wang)往(wang)(wang)被拆成十(shi)幾段流式(shi)輸(shu)出(chu),傳(chuan)統基(ji)于(yu)關(guan)鍵詞和規則的(de)(de)專家模型(xing),面(mian)對這類(lei)語義復雜、上(shang)下文強依賴的(de)(de)模型(xing)輸(shu)出(chu)時,最終結果(guo)往(wang)(wang)往(wang)(wang)是(shi)“看(kan)得見(jian)字(zi),但不(bu)懂(dong)意”; -
另(ling)一方面(mian),如果全部依(yi)賴大模型審核,雖然理(li)解(jie)能力強,但因推理(li)耗(hao)時長(chang)且(qie)成本(ben)高,難以滿足車(che)載場景對實時性(xing)的嚴苛要(yao)求;
-
所有輸入/輸出文本實時切片后,由(you)輕量級(ji)(ji)專家模型并行執(zhi)行毫秒級(ji)(ji)初篩,快(kuai)速攔截明顯風(feng)險;
-
同時,重新編排大模型深度審核鏈路(lu),利用多線程智能化(hua)調度;
-
通(tong)過唯(wei)一標識關聯一次完整對(dui)話; -
安全護欄自動聚合(he)同一會話中的(de)所(suo)有切片,進行跨片段語義(yi)理解(jie); -
即使(shi)敏感內容分散在多輪輸(shu)出(chu)中,也能精準識別并攔截;
-
對(dui)所有聯(lian)網請求中的(de)第三(san)方(fang)鏈接進行實時(shi)掃描; -
精準(zhun)識(shi)別(bie)色情信息、非法賭(du)博、釣(diao)魚(yu)網站(zhan)、虛假營銷等風險(xian)類型: -
一旦命中(zhong)高風險標簽,立即終止任務,防止有害信息流入大模型(xing)。

