大數據體系會議論文選登
Social media account classification based on multimodal feature fusion
湯智偉,明 楊,費高雷,翟學萌,胡光岷
doi: 10.19358/j.issn.2097-1788.2023.10.001
社交媒體賬號分類方法從賬號的屬性信息出發,通過構建賬號特征從而對賬號進行分類,對從海量社交媒體數據中挖掘有價值的信息具有十分重要的作用。現有社交媒體賬號分類一般基于用戶發布的信息提取特征,存在賬號信息描述不完整、分類有效性低的問題。針對上述問題,提出了一種基于多模態特征融合的社交媒體賬號分類方法。該方法綜合考慮賬號自身屬性、文本以及賬號之間的社交關系等信息,使用張量分析的方法對賬號所表現的多模態特征進行融合。相比現有方法,所提方法可以更好地利用賬號的各種信息,獲得更好的分類效果。通過實驗,所提方法準確率達到了93.74%。
Research on highresolution remote sensing image segmentation model
劉姝妍,何 柳,陶 劍,卓雨東,王浩東
doi: 10.19358/j.issn.2097-1788.2023.10.002
高分辨率遙感影像往往蘊含著豐富的地物信息、復雜的拓撲關系和多變的目標對象,給復雜環境下情報識別與分析帶來了挑戰。為了高效、快速、精確地獲取到遙感圖像中的關鍵信息,在主流圖像分割的編碼-解碼模式的基礎上,提出了一種全新的遙感圖像分割方法,內部引入了多種注意力機制以及多尺度的特征表示結構,增強了對遙感圖像的解譯能力,提升了最終的目標分割效果。在公開數據集上的實驗表明,所提方案可以在保持低參數量的情況下,明顯優于其余基線方法。
Mixed preference analysis federated recommendation framework
宋雨倫,李大中,張絲雨,莊 媛,崔玲龍,王功舉,閆 龍
doi: 10.19358/j.issn.2097-1788.2023.10.003
針對基于內容推薦算法存在過擬合及過度專業化問題,提出了一種混合個體及群體偏好分析的聯邦推薦框架,該框架包含三個模塊:基于隨機森林的偏好分析模塊、基于聯邦的相似興趣用戶分群模塊、基于混合偏好分析的推薦模塊。在基于隨機森林的偏好分析模塊中,提出考慮組合因素的同一屬性間偏好度分析和結合信息熵的不同屬性間在意度分析方法,通過糾正與真實興趣屬性具有強關聯性的非興趣屬性影響,初步解決了算法的過擬合問題;在基于聯邦的相似興趣用戶分群模塊和混合偏好分析的推薦模塊中,通過基于聯邦的相似興趣用戶分群模塊和群體的同屬性異屬性分析,得到用戶所在興趣群體的同屬性異屬性偏好信息,并通過網格遍歷群體和個體的超參權重混合進行資源推薦,解決了推薦系統存在的過度專業化問題,提高算法在特定任務上的表現。實驗結果表明所提算法相較于隨機森林算法在各方面指標上有明顯提升,且提高了推薦系統的可解釋性。
Research on data management architecture and application based on metadata separation
周俊鵬,任德旺,倪 鑫,李麗娜,李亞暉,李運喜
doi: 10.19358/j.issn.2097-1788.2023.10.004
針對現有嵌入式工業計算設備的數據分散、管理不足等問題,提出了一種基于元數據分離的數據管理體系結構。融合數據特性需求,設計了一種數據統一標準化處理的規則庫,構建了元數據信息組織模型、索引存儲結構及標準格式的數據文件,實現了數據文件與元數據分離存儲的管理模式,將數據文件存儲至索引目錄磁盤,元數據信息實時寫入時序數據庫。初步開發了數據管理的應用原型系統,提升以元數據模型為基準的數據分級組織管理能力,實現數據互聯互通,提高以業務為導向的數據管理應用服務效能。
Research on the evaluation and analysis method of radar power range based on multisource data fusion
劉鎮瑜,林 歡,燕明亮,李詠晉,陳 磊
doi: 10.19358/j.issn.2097-1788.2023.10.005
傳統意義上,由于無法找到大量獨立同分布的樣本,雷達威力范圍評估分析是小樣本問題。從雷達威力范圍方程出發,分析其中和雷達本身工作狀態、參數密切相關的個性因素,以及和雷達本身無關的目標環境、氣象環境、操作使用等共性因素,對不同因素分別進行處理,形成能夠關聯不同雷達測試數據的雷達威力范圍方程。分析整理歷史上目標雷達截面積數據,確定其分布規律;結合雷達測試數據分析共性因素的分布規律;確定雷達威力范圍的分布規律,給出雷達威力范圍的點估計和區間估計。經過試驗分析,所提方法與其他相關方法相比有較好的優越性。
網絡與信息安全
Detection of malicious encrypted network traffic based on temporal and spatial principal component analysis
孟 楠,周成勝,趙 勛,王 斌,姜喬木
doi: 10.19358/j.issn.2097-1788.2023.10.006
惡意加密流量檢測對關鍵信息基礎設施的可靠運行至關重要,也是應對DDoS攻擊等網絡威脅的有效手段。利用時空主成分分析技術,構建了時間維度和空間維度的網絡流量變化模型,實現惡意加密流量的實時檢測和追蹤溯源。在時間維度,利用歷史積累的網絡流量監測信息進行主成分分析,構建瞬時流量預測模型與實際監測流量之間的平方預測誤差,判定網絡中出現惡意加密流量的時刻。在空間維度,利用歷史積累的各國家和地區的網絡流量監測數據,構建區域流量預測模型與實際監測流量之間的平方預測誤差,對惡意加密流量的來源地進行追蹤溯源。最后,設計了一種可用于現網部署的算法實現流程,并分析了相比其他已有算法帶來的能力提升。
Research on blockchain access control methods based on policy and attribute hiding
楊志謀,文 強,張 帥,張功國,孫 銳
doi: 10.19358/j.issn.2097-1788.2023.10.007
針對訪問控制過程中缺乏對用戶隱私保護的問題,提出了一種基于策略和屬性隱藏的區塊鏈訪問控制方案。首先,基于Hyperledger Fabric平臺編寫訪問請求、屬性管理和策略管理鏈碼,搭建基本的基于屬性的訪問控制模型,實現了細粒度的訪問控制。其次,使用AES對稱加密算法和屬性基加密算法將資源進行加密存儲,再將存儲地址和資源哈希上傳到區塊鏈上,確保數據的安全性和完整性。最后,使用Paillier同態加密算法將用戶屬性和訪問策略加密并上傳到區塊鏈上,確保訪問過程中用戶的隱私安全。通過方案對比和仿真實驗說明了本文方案能夠有效保護用戶的隱私。
Design of a multi-to-multi electronic voting scheme based on homomorphism
霍珊珊,李艷俊,劉 健,羅昕銳
doi: 10.19358/j.issn.2097-1788.2023.10.008
電子投票方案通常基于安全多方計算、盲簽名、同態加密和秘密共享等密碼學技術設計,并通過網絡實現。與傳統的投票方案相比,各個角色的隱私得到了更好的保護,投票和計票過程更安全高效。基于Paillier密碼的同態性設計了多對多的電子投票方案,采用預計算三元組的方式在不解密選票的情形下對贊同、棄權、反對選項進行合規性判斷;然后通過密碼同態性合成總投票、計票中心解密后便能夠從m個候選人中選出t個勝出者;最后證明了方案的正確性和安全性,并分析了方案實現需要的通信代價和投票人、可信中心以及計票員的計算量。方案整體實現效率高,適用于大型電子投票的場合。
數據治理
Research on interest measurement in competition law regulation of data capture behavior
聶 童
doi: 10.19358/j.issn.2097-1788.2023.10.009
數據是數字市場競爭格局形成中的核心要素,然數據抓取作為獲得數據要素的重要手段卻備受爭議。數字經濟蓬勃發展的今天,利益衡量這種古老的解釋方法,對于數據抓取行為的競爭法規制仍然具有較強回應性。從利益衡量的角度出發,以平臺經營者利益、消費者利益及社會公共利益的多元利益維度展開,判斷其各方主體的利益沖突實質和利益的屬性。利益衡量為數據抓取行為的競爭法規制勘定邊界,亦為數據要素市場的建設提供價值序位考量,并暗含解決數據抓取行為這一復雜問題的指向,即建設統一的數據要素市場。
計算法學
Tort liability of companion AI platforms in the era of attention economy
唐 婧
doi: 10.19358/j.issn.2097-1788.2023.10.010
注意力經濟背景下,傳統技術中立理論受到沖擊。在侵權責任規制上,應為具有情感連接功能的陪伴式人工智能平臺找尋新的規制路徑。這一路徑不應完全脫離當前以過錯責任為主的侵權責任體系,但由于陪伴式人工智能平臺的算法可能引發廣泛且嚴重的損害,因此在規制的整體態度上,保持相對嚴格的歸責傾向;而在具體的司法實踐中,以舉證責任倒置等方法補足直接運用過錯責任的缺陷,并對未來建立陪伴式人工智能平臺的通用規則持樂觀態度。
The exploration of trade secrets protection path of corporation data pool
胡浩翔
doi: 10.19358/j.issn.2097-1788.2023.10.011
“數據池”是數據生產要素的重要表現形式,對促進數字經濟發展、推動產業轉型具有積極作用。但我國目前缺乏數據權利基礎制度,著作權法和數據共享協議都未能對數據池提供全面的法律保護。此種情況下,可以通過商業秘密相關法律規范對數據池予以保護,但數據池必須滿足商業秘密的秘密性、價值性和保密措施構成要件。在分析數據池秘密性構成要件時,應當重點認識公開信息形成的新信息可以具有秘密性,企業間數據池共享的行為也不會使其喪失秘密性。
Unveiling the "algorithmic veil": reflection on building an algorithmic interpretation framework
劉 燁
doi: 10.19358/j.issn.2097-1788.2023.10.012
如何解決算法可解釋性問題是算法治理中的一個重要法律議題,囿于算法使用者與受眾之間不斷擴大的“解釋鴻溝”,現階段算法解釋困境存在于算法運行、決策形成到應用的過程之中,具體體現在數據識別的失衡、證明依據的不足和損害結果的泛化三方面。考慮到不同算法運用場域之下解釋需求的差異,借助體系思維構建起算法解釋框架,或將成為解決可解釋性問題的突破口。以解釋對象為邏輯起點將解釋方法劃分為定向告知、公開披露和行政報備三種模式,并基于“場景公正”理念將其應用于醫療、信息推薦、金融等領域,針對不同業務和場景區分可解釋性程度和標準,以期實現算法可解釋。
行業應用
Research on data security sharing technology of the legal inspection department based on blockchain
湯雪珂,蔡全旺,汪慧君
doi: 10.19358/j.issn.2097-1788.2023.10.013
針對法院、檢察院和司法行政機關等單位傳遞與共享案件數據過程中面臨的身份偽冒、監管困難、隱私泄露和數據濫用等安全風險,提出一種基于區塊鏈技術的法檢司數據安全共享模型。通過模擬實驗,驗證了模型的可行性,并且對基于區塊鏈的法檢司數據安全共享涉及的混合加密技術、可信計算技術、數據共享管控智能合約以及基于區塊鏈的跨域身份認證技術進行了闡述,以期提升數據資源共享環節的安全防護能力。
Research on the application of road zero trust security based on dual mode single packet authorization
陳 瑜,殷 浩,姚 蕾,馮 鼎,管浩杰,嚴 浩
doi: 10.19358/j.issn.2097-1788.2023.10.014
針對交通信息系統工程具有接入范圍復雜、網絡安全風險大的特點,提出了公路全面零信任系統架構。該架構主要由網關管理平臺、可信身份管控平臺等6個平臺組成。重點研究了基于網關管理平臺的安全交互過程,一是實現多物理環境下自動路由策略;二是研究雙模SPA敲門機制,重點分析UDP認證和TCP敲門數據訪問。依托智慧農路系統工程,評估了應用前后安全訪問的效果和效率。研究結果表明,公路零信任系統可在國產芯片Loongson3A4000上運行;雙模單包授權SPA技術在UDP SPA基礎上拓展了TCP SPA能力,比單模SPA訪問速率快50%;在滿足三級等保控制點的基礎上可實現網絡隱身。