基于梯度優化的大語言模型后門識別探究
所屬分類:技術論文
上傳者:wwei
文檔大小:1222 K
標簽: 大語言模型 后門攻擊 基于梯度的后門識別
所需積分:0分積分不夠怎么辦?
文檔介紹:隨著大語言模型的流行并且應用在越來越多的領域,大語言模型的安全問題也隨之而來。 通常訓練大語言模型對數據集以及計算資源有著極為苛刻的要求,所以有使用需求的用戶大部分都直接利用網絡上開源的數據集以及模型,這給后門攻擊提供了絕佳的溫室。后門攻擊是指用戶在模型中輸入正常數據時模型表現像沒有注入后門時一樣正常,但當輸入帶有后門觸發器的數據時模型輸出異常。防止后門攻擊的有效方法就是進行后門識別。目前基于梯度的優化方法是比較常用的,但使用這些方法時內部影響因子的設定對識別效果具有一定影響。文章就詞令牌數量、最鄰近數量、噪聲大小進行了實驗測量和作用機制的分析,以便為后續使用這些方法的研究者提供參考。
現在下載
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。
主站蜘蛛池模板: aa日本| 26uuu天天夜夜综合 | 欧美一级黄视频 | 国产亚洲精品久久精品6 | 99国产精品一区二区 | 国产欧美一区二区三区沐欲 | 国产日韩欧美精品一区二区三区 | 亚洲天堂二区 | 国产精品二区高清在线 | 另类二区三四 | 日韩伦理一区二区三区 | 日本aaaa片毛片免费观看 | 中文一级毛片 | 日韩专区欧美 | 成人羞羞视频国产 | 一区二区三区在线 | 网站 | 国产v日韩v欧美v精品专区 | 国产高清一级毛片在线不卡 | 成年人毛片| 欧美日韩国产综合一区二区三区 | aaaa级毛片欧美的 | 999热精品这里在线观看 | 亚洲欧美日韩在线播放 | 久久99精品九九九久久婷婷 | 国产性色 | 久草视频手机在线 | 国产成人精品一区二区免费视频 | 国内精品久久久久久久亚洲 | 性a爱片免费视频性 | 亚洲综合第一欧美日韩中文 | 中文字幕在线观看亚洲日韩 | 成人国产网站v片免费观看 成人国产午夜在线视频 | 美女va| 中文字幕在线欧美 | 国产精品日韩专区 | 欧美 亚洲 丝袜 清纯 中文 | 精品一区二区三区视频在线观看免 | 99久久精品国产一区二区成人 | 日本美女作爱 | 亚洲欧美在线综合一区二区三区 | 久久精品视频大全 |