銆愭枃鐚暣鐞嗐€戠綉缁滃畨鍏ㄩ鍩熺殑鍙В閲婃€I [姒傝堪]

璧㈤暱 · 鍙戣〃浜� 2022-11-30 17:10:53

鏈夎澶氱爺绌跺伐浣滃皾璇曞皢浜哄伐鏅鸿兘鏂规硶搴旂敤浜庣綉缁滃畨鍏ㄩ鍩燂紝浣咥I鏂规硶鐨勯粦鐩掔壒鎬ч樆纰嶄簡鍏剁湡姝ｇ殑钀藉湴搴旂敤銆傝繎鍑犲勾锛屽彲瑙ｉ噴AI锛圶AI锛変篃鎴愪负缃戠粶瀹夊叏棰嗗煙鐨勯噸鐐瑰叧娉ㄦ柟鍚戙€�
鏈枃閫氳繃闃呰浠ヤ笅璁烘枃锛屽杩欎釜棰嗗煙鏈変竴涓ぇ浣撶殑姊崇悊鍜屾妸鎻°€傞拡瀵笹NN妯″瀷鍙В閲婃€ф柟娉曠浉鍏冲伐浣滅殑姊崇悊瑙併€奊NN鍙В閲婃€ф柟娉曟€荤粨銆嬨€�

[1] Explainable Arti铿乧ial Intelligence for Cyber Threat Intelligence (XAI-CTI)
[2] Explainable Artificial Intelligence in Cybersecurity: A Brief Review
[3] Explainable Artificial Intelligence Applications in Cyber Security: State-of-the-Art in Research
[4] Explainable Artificial Intelligence in CyberSecurity: A Survey
[5] Explainable machine learning in cybersecurity: A survey
[6] SoK: Explainable Machine Learning for Computer Security Applications锛堝疄楠屽涓婚〉Cyber Analytics Lab锛�
[7] Evaluating Explanation Methods for Deep Learning in Security锛孍uroS&P鈥�20锛�缃戠珯鍙婁唬鐮乭ttps://github.com/alewarne/explain-mlsec锛�

瀹夊叏棰嗗煙涓嶅悓瑙掕壊涓媂AI搴旂敤鍦烘櫙[6]

XAI鍒嗙被鏂瑰紡

XAI鍒嗙被鏂规硶[6]

鍐呭湪鐨勶紙intrinsic/transparent锛夊拰浜嬪悗鐨勶紙post-hoc/extrinsic锛�銆傚墠鑰呭叧娉ㄦā鍨嬭缁冨拰鎵ц闃舵锛屽皢鍐崇瓥瑙勫垯銆佹敞鎰忓姏鏈哄埗銆佹帹鐞嗚矾寰勩€佹帺鐮併€佷笌鎴栧浘绛夋妧鏈粨鍚堝埌妯″瀷涓€傝€屼笖锛� 濡傜嚎鎬фā鍨嬨€丼VM銆佸喅绛栨爲銆乆GBoost绛夊ぉ鐢熷氨鍏锋湁杈冨己鐨勫彲瑙ｉ噴鎬с€傞殢鐫€鏈鐨勮鑼冭繖绫绘ā鍨嬩篃琚О涓衡€渋nterpretable鈥濄€傚悗鑰呭垯鍦ㄦā鍨嬫敹鏁涘悗瑙ｉ噴鍏朵腑鐨勫悇涓粍浠讹紝搴旂敤杈冨鐨勬槸妯″瀷鏃犲叧锛坢odel-agnostic锛夌殑鏂规硶锛屽寘鎷彲瑙嗗寲銆佸弽浜嬪疄鍒嗘瀽銆佷唬鐞嗘ā鍨嬨€佹蹇甸噸瑕佹€с€丩IME銆丼HAP绛夋妧鏈€�
妯″瀷鏈夊叧鐨勶紙model-specific锛夋垨妯″瀷鏃犲叧鐨勶紙model-agnostic锛�銆傚悗鑰呴€氬父鍒嗘瀽鐗瑰緛銆佽緭鍏ャ€佽緭鍑虹瓑閮ㄥ垎锛岀悊璁轰笂鍙互鍦ㄤ笉璁块棶妯″瀷鍐呴儴淇℃伅鐨勬儏鍐典笅锛屽簲鐢ㄤ簬浠讳綍ML妯″瀷銆�
鏈湴鐨勶紙local锛夋垨鍏ㄥ眬鐨勶紙global锛�銆傚墠鑰呭彧瑙ｉ噴閽堝鍗曚釜鏁版嵁鏍锋湰鐨勯鍛筹紝鍚庤€呰В閲婃暣涓ā鍨嬬殑鎵€鏈夎涓恒€�
鍙В閲婃€ф柟娉曠殑缁撴灉杈撳嚭褰㈠紡鍖呮嫭锛氭枃鏈€佸彲瑙嗗寲銆佹ā鍨嬪唴閮ㄥ伐浣滈€昏緫銆佽鎹紙arguments锛夌瓑銆�
甯歌XAI妗嗘灦鍖呮嫭LIME, SHAP, Anchors, LORE, CRAD-CAM, CEM绛夈€傞櫎CRAD-CAM澶栵紝鍏跺畠閮藉睘浜嶽鏈湴銆佷簨鍚庛€佹ā鍨嬫棤鍏砞鐨勮В閲婃柟娉曪紝CRAD-CAM涓篬鏈湴銆佷簨鍚庛€佹ā鍨嬬浉鍏砞銆�

甯哥敤XAI鏂规硶姹囨€籟6]

缁忓吀缃戠粶瀹夊叏棰嗗煙XAI鐮旂┒

瀹夊叏棰嗗煙ML鍙В閲婃€у彂灞曡矾绾縖5]

閫氱敤妗嗘灦

Lemna: Explaining deep learning based security applications锛孋CS鈥�18
Deepaid: interpreting and improving deep learning-based anomaly detection in security applications锛孋CS鈥�21
CADE : Detecting and explaining concept drift samples for security applications锛孶S鈥�21

鎭舵剰杞欢妫€娴嬶紙Malware锛�

Explaining Black-box Android Malware Detection, EUSIPCO&#39;18锛�
Explaining AI for Malware Detection: Analysis of Mechanisms of MalConv, IJCNN&#39;20
Effective detection of mobile malware behavior based on explainable deep neural network, Neurocomputing&#39;21
Towards an interpretable deep learning model for mobile malware detection and family identification, C&S&#39;21
Can We Trust Your Explanations? Sanity Checks for Interpreters in Android Malware Analysis, TIFS鈥�21

閽撻奔銆佸瀮鍦鹃偖浠跺強娆鸿瘓妫€娴嬶紙Phishing & Spam & Fraud锛�

An Explainable MultiModal Hierarchical Attention Model for Developing Phishing Threat Intelligence, TDSC&#39;22
Phishing Email Detection Using Persuasion Cues, TDSC&#39;22
Phishpedia: A hybrid deep learning based approach to visually identify phishing webpages锛孶S&#39;21
Explainable Machine Learning for Fake News Detection, &#39;19
Explainable Machine Learning for Fraud Detection, &#39;21
xFraud: Explainable Fraud Transaction Detection, &#39;21

鍍靛案缃戠粶妫€娴�

Subspace Clustering for Interpretable Botnet Traffic Analysis, ICC&#39;19
Detection and Classification of Botnet Traffic using Deep Learning with Model Explanation, TDSC&#39;22
BotStop鈥�: Packet-based efficient and explainable IoT botnet detection using machine learning, &#39;22
First Step Towards EXPLAINable DGA Multiclass Classification. &#39;21
Interpretability evaluation of botnet detection model based on graph neural network, infocom W鈥�22

缃戠粶鍏ヤ镜妫€娴�

Achieving explainability of intrusion detection system by hybrid oracle-explainer approach锛孖JCNN&#39;20
An Explainable AI-Based Intrusion Detection System for DNS Over HTTPS (DoH) Attacks, TIFS&#39;22
EXPLAIN-IT: Towards explainable AI for unsupervised network traf铿乧 analysis, CoNext&#39;19
ROULETTE: A neural attention multi-output model for explainable network intrusion detection, &#39;22

甯哥敤鏁堟灉璇勪及鎸囨爣

鎻忚堪鍑嗙‘鎬э紙descriptive accuracy锛孌A锛�锛屽弽鏄犺В閲婃柟娉曟崟鎹夌浉鍏崇壒寰佺殑鍑嗙‘绋嬪害銆傚疄楠屼腑閲囧彇闂存帴娴嬮噺鐨勬墜娈碉紝鍗宠瀵熷垹闄ゆ渶鐩稿叧鐨則op K鐗瑰緛鍚庢ā鍨嬮娴嬬粨鏋滀細鍑虹幇澶氬ぇ绋嬪害鐨勬敼鍙樸€�
鎻忚堪绋€鐤忔€э紙descriptive sparsity锛孌S锛�锛屽弽鏄犱簡瑙ｉ噴鏂规硶鏄惁鍙互鏈夋晥鍖哄垎涓嶅悓缁村害鐨勭壒寰佷俊鎭€傞渶瑕佹敞鎰忕殑鏄紝DS涓嶥A骞朵笉鐩稿叧锛岄渶瑕佸叏闈㈣　閲忋€�
瀹屾暣鎬э紙completeness锛�锛屽嵆鍙互鍦ㄦ墍鏈夊彲鑳界殑鎯呭喌涓嬩骇鐢熷悎鐞嗙殑瑙ｉ噴缁撴灉鑰屼笉鍑虹幇閫€鍖栵紙闆惰В閲婄殑鎯呭喌锛夈€�
绋冲畾鎬э紙stability锛�锛屾煇鏂规硶澶氭杩愯鍚庣敓鎴愮殑瑙ｉ噴缁撴灉澶ц嚧淇濇寔涓€鑷淬€傝€屽疄闄呮儏鍐垫槸锛屽ぇ澶氭暟榛戠洅瑙ｉ噴鏂规硶鍩轰簬闅忔満鎵板姩杩愯锛屽彲鑳藉鑷寸浉鍚岃緭鍏ヤ笅鐨勪笉鍚岀粨鏋溿€�
鏁堢巼锛坋fficiency锛�锛屽湪澶勭悊澶ч噺鏁版嵁鏃讹紝鍙互鍦ㄥ悎鐞嗙殑鏃堕棿缁欏嚭瑙ｉ噴缁撴灉銆�
椴佹鎬э紙robustness锛�锛屽湪瀹夊叏棰嗗煙锛屽彲瑙ｉ噴鎬ф柟娉曞彲鑳戒細鍙楀埌瀵规姉鎵板姩褰卞搷锛岃繑鍥炰笉鐩稿叧淇℃伅銆�

		鑷姩鐧诲綍	鎵惧洖瀵嗙爜
瀵嗙爜			绔嬪嵆娉ㄥ唽

銆愭枃鐚暣鐞嗐€戠綉缁滃畨鍏ㄩ鍩熺殑鍙В閲婃€I [姒傝堪]

娴忚杩囩殑鐗堝潡