生成式人工智能安全
Large language model based on sentence granularity prompts for temporal knowledge Q&A approach
李志東,羅琪彬,喬思龍
doi: 10.19358/j.issn.2097-1788.2023.12.002
知識問答是自然語言處理領域的研究熱點之一,而時序知識問答還需考慮知識的時序關系,更是研究難點所在。當前時序知識問答方法通常將知識和問題的詞向量相似度作為回答的重要依據,忽略了知識所蘊含的句粒度語義信息。對此,提出了一種基于句粒度提示的大語言模型時序知識問答方法,首先通過對句粒度提示的改進,讓大語言模型高效學習句粒度語義信息,同時驗證大語言模型在Zeroshot、Fewshot及弱監督微調下時序知識問答能力。在ICEWS0515數據集上進行實驗,所提方法回答正確準確率得到可觀提升,體現了基于句粒度提示的大語言模型時序知識問答方法的有效性。
Intelligent chaoqing based on large models: event key point extraction and report generation
曾文龍1,劉丹2,張超1
doi: 10.19358/j.issn.2097-1788.2023.12.004
隨著信息爆炸時代的到來,如何利用抄清手段高效地從海量數據中提取有價值的信息并生成準確的抄清報告成為了情報分析和推理領域的重要挑戰。傳統的手動抄清方法難以應對數據量龐大、多樣性高的情報數據,因此需要借助自然語言技術提升抄清分析效率和準確性。提出了一種基于大模型的智能抄清方法,旨在通過事件要點抽取和報告生成,實現高效、準確和可靠的情報分析和推理。該方法利用自然語言處理技術對抄清數據進行分析,結合語法及語義信息進行文檔事件要點信息抽取,基于大模型的生成能力,生成全面且內容豐富的抄清報告。
Copyright protection for deep learning models utilizing a black box testing framework
屈詳顏1,2,于靜1,2,熊剛1,2,蓋珂珂3
doi: 10.19358/j.issn.2097-1788.2023.12.001
當前生成式人工智能技術迅速發展,深度學習模型作為關鍵技術資產的版權保護變得越發重要。現有模型版權保護方法一般采用確定性測試樣本生成算法,存在選擇效率低和對抗攻擊脆弱的問題。針對上述問題,提出了一種基于黑盒測試框架的深度學習模型版權保護方法。首先引入基于隨機性算法的樣本生成策略,有效提高了測試效率并降低了對抗攻擊的風險。此外針對黑盒場景,引入了新的測試指標和算法,增強了黑盒防御的能力,確保每個指標具有足夠的正交性。在實驗驗證方面,所提方法顯示出了高效的版權判斷準確性和可靠性,有效降低了高相關性指標的數量。
Research on gradient optimization based backdoor identification of large language model
陳佳華1,陳宇2,曹婍3
doi: 10.19358/j.issn.2097-1788.2023.12.003
隨著大語言模型的流行并且應用在越來越多的領域,大語言模型的安全問題也隨之而來。 通常訓練大語言模型對數據集以及計算資源有著極為苛刻的要求,所以有使用需求的用戶大部分都直接利用網絡上開源的數據集以及模型,這給后門攻擊提供了絕佳的溫室。后門攻擊是指用戶在模型中輸入正常數據時模型表現像沒有注入后門時一樣正常,但當輸入帶有后門觸發器的數據時模型輸出異常。防止后門攻擊的有效方法就是進行后門識別。目前基于梯度的優化方法是比較常用的,但使用這些方法時內部影響因子的設定對識別效果具有一定影響。文章就詞令牌數量、最鄰近數量、噪聲大小進行了實驗測量和作用機制的分析,以便為后續使用這些方法的研究者提供參考。
Data security risks of generative large model and its legal governance
劉羿鳴1,林梓瀚2
doi: 10.19358/j.issn.2097-1788.2023.12.005
生成式大模型具有廣泛的應用前景。大模型的訓練和運行均需要海量數據的支撐,極有可能引發數據安全風險。認知風險是化解風險的前提,需要從靜態、動態兩個視角建立起大模型應用數據安全風險的認知體系。結合歐盟、美國等大模型的治理經驗,針對我國大模型數據安全風險治理存在的不足,建議建立基于數據安全風險的分類監管路徑、完善基于大模型運行全過程的數據安全責任制度、探索基于包容審慎監管的創新監管機制,為實現大模型應用的可信未來提供充分的法治保障。
網絡與信息安全
TOR anonymity network traffic recognition method integrating protocol information fusion
楊剛1,姜舟1,張嬌婷1,汪俊永1,王強2,3,張研1
doi: 10.19358/j.issn.2097-1788.2023.12.007
TOR(The Onion Router)匿名網絡流量識別是一項重要的加密流量檢測任務,隨著TOR混淆模式的迭代更新,引入OBFS4(ObjectBased File System4)混淆協議后對TOR的檢測較為困難。詳細研究了TOR行為和混淆協議特性,將關鍵行為特征與OBFS4混淆協議特征進行融合,增強了面向混淆協議的TOR流量的檢出能力。另外構造了包含瀏覽網頁、視頻直播、聊天等多業務數據集進行實驗。結果顯示,該研究方法在基于OBFS4混淆協議的TOR流量檢測任務上效果顯著,其中lightGBM模型檢測效果最佳,在融合協議特征的方法下準確率達到9889%。同時該方法面向不同版本的TOR流量開展復測,在不同版本的TOR流量檢測任務中準確率均高于97%。
Internet of Things security posture prediction based on ADE ABiGRU
彭興維1,袁凌云1,2
doi: 10.19358/j.issn.2097-1788.2023.12.008
針對物聯網安全態勢預測的復雜性和多變性,提出一種基于ADEABiGRU的物聯網安全態勢預測模型。該模型融合了雙向門控循環單元、多頭注意力機制和殘差結構,并經由自適應差分進化算法調優,增強了對復雜時序依賴性的捕捉和對數據的多維度分析能力。通過改進自適應差分進化算法的自適應機制,充分考慮時序數據特征,以提升全局搜索效率和局部逼近精度。在ToN_IoT數據集上的實驗結果表明,與傳統算法相比,該模型在MAPE、R2和MSE上均表現出色,展現出更高的預測準確性和穩定性。
A systems thinking for cybersecurity modeling
嚴定宇,張宇鵬,陸希玉,曹華平
doi: 10.19358/j.issn.2097-1788.2023.12.006
解決網絡空間安全問題需要對網絡空間中的組成部分、因素、結構及其相互作用有一個整體性的理解,但傳統式建模方法更注重技術性問題,缺乏從宏觀的視角看待網絡空間安全。嘗試討論把系統思維方式應用到網絡空間安全的建模上。首先回顧了系統思維方式,列舉了網絡空間中與安全相關的領域、組成部分、影響因素以及它們間的交互情況。其次,針對網絡空間安全建模的困難與挑戰,對能夠解決相關問題的系統理論與方法進行了舉例。最后,提出了一個針對網絡空間安全建模的系統思維框架,涵蓋了方法論、理論、技術和實踐等內容。該研究認為系統思維是開展網絡空間安全建模的重要工具之一,幫助研究人員和從業人員去探索、刻畫、理解、評估及預測網絡空間安全相關的內容。
數據安全
A data security sharing and interaction framework based on privacy computing technology
張鵬1,李美鵬1,郭兆中2,劉文杰1,孫立群1
doi: 10.19358/j.issn.2097-1788.2023.12.009
隱私計算作為一種數據安全交互解決手段,是由兩個或多個參與方聯合計算的技術和系統,參與方可以在不泄露各自數據的前提下通過協作對數據進行聯合機器學習和分析,隱私計算可實現“數據可用不可見”“數據不動模型動”,具備強化數據安全合規性、確保隱私數據不泄露的能力,可以說是現階段數據安全交互與敏感信息保護的“最優解”。圍繞數據安全共享與協同應用,提出基于隱私計算技術的共享交互框架設計方案,結合業務實際分別給出技術架構和邏輯架構設計,分析關鍵技術和利弊,為數據的安全交互和開發利用提供解決思路。
Research of data security based on cybersecurity classified protection
李尚號,王勇
doi: 10.19358/j.issn.2097-1788.2023.12.011
通過深度剖析網絡安全和數據安全的內在聯系,探討將數據安全保護納入網絡安全等級保護工作流程的必要性與可行性,提出具體的工作步驟與實施過程。在落實等級保護的基礎上,有序推進數據安全保護,快速、有效、體系化地開展數據安全保護工作,實現網絡基礎設施安全和上層業務數據安全一體的真正數據安全。
High concurrency and reliable access method for massive heterogeneous data based on dynamic balancing technology
趙勛,周成勝,靳文京,劉曉曼,王桂溫
doi: 10.19358/j.issn.2097-1788.2023.12.010
隨著大數據時代的到來,海量異構數據的高并發可靠接入成為了一個亟待解決的問題。提出了一種基于動態均衡技術的海量異構數據高并發可靠接入方法。該方法采用去中心化的任務分配機制實現海量數據源接入;針對各類異構數據源設計了基于HTTPS、SFTP、Kafka等多樣化采集手段及相應的節點分配和回收機制;采用動態負載均衡策略對采集資源進行實時調整,以適應不斷變化的數據負載,實現高并發處理。該研究為實現海量異構數據的高效、可靠接入提供了一種有效的解決方法。
數據治理
Data altruism: a new concept of data governance in the EU and its implications
張藝洋
doi: 10.19358/j.issn.2097-1788.2023.12.012
歐盟數據治理法(DGA)的正式出臺標志著歐盟數據治理模式開始轉型。該法的重心在于通過貫徹利他主義這一核心理念來強化公共數據的再利用。利他主義作為一種新的數據治理理念,對之進行系統分析,有利于為我國數據治理所借鑒利用。首先梳理歐盟數據治理歷程和邏輯框架,數據利他主義是發展到現數據共享階段的必然結果,分析數據利他主義治理的概念及其特點、其指導下的數據治理模式,如公共機構部門共享模式和數據中介共享模式。進而對DGA尤其是該法貫徹的利他理念進行評析,在此基礎上為我國數據治理提出借鑒思路。我國宜從發展數據利他主義理念、引入多元數據共享主體和完善數據共享立法體系的角度對之加以借鑒。
Study of the requirements, methods and strategies for intranet sensitive big data exchanging between various networks or network areas
李祺睿1,2,蔣晶晶2,張加洪2
doi: 10.19358/j.issn.2097-1788.2023.12.013
針對內網敏感大數據治理和應用,分析闡述了數據采集報送、引接匯聚、分發共享、綜合應用過程中跨網域跨密區數據流轉和信息交互需求,對比研究了各類跨網域跨密區數據交換技術方法,并提出了面向應用需求實現跨網域跨密區數據交換的方法策略,為內網大數據建設運用提供技術支持和策略建議。
網絡與通信
Design and implementation of a elastic self organizing multi cluster management system
夏令明, 周俊,趙鋒
doi: 10.19358/j.issn.2097-1788.2023.12.014
Kubernetes等云原生技術在業界應用時,承載能力有限,無法滿足更高可用性要求,且易被云供應商鎖定;東數西算等戰略的實施運行,需以多集群管理技術為基礎,但是傳統的云管平臺難以滿足跨多云應用的服務部署和治理的挑戰。提出軟件定義的自組織基礎設施管理、冪等的分層調度新理念,實現以集群為最小單位的彈性基礎設施管理架構,將多個Kubernetes集群組成中心式、去中心式、樹狀等任意拓撲結構,進行應用的跨云調度及管理。方案基于樹狀集群結構進行了測試驗證,并與其他方案對比,測試結果表明該方案能夠滿足未來分布式云場景下海量集群組織管理需求,且保持接入新集群不超過1 s,應用的調度延遲不超過200 ms。
行業應用
Design and implementation of the 3D visualization system for target and situation
楊垚,劉永海,肖雅娟,卞泊
doi: 10.19358/j.issn.2097-1788.2023.12.015
為提升大規模數據下態勢展示的性能和效果,對態勢展示的關鍵技術進行研究,設計并實現了實時態勢監控、歷史態勢回放、目標三維可視化等功能的系統。該系統利用數據清洗、數據插值和數據融合等技術對多源異構態勢數據進行實時處理;然后將處理后的數據儲存于多級數據存儲系統中,通過緩存和批量數據獲取機制提升數據加載效率;最后,基于瀏覽器和GIS服務實現目標與態勢的三維地理空間可視化。仿真結果表明,該系統態勢數據獲取快速高效,態勢展示效果立體清晰,能夠滿足大型模擬對抗演習中的目標分析、態勢監控和回放需求。