强化学习驱动的企业网络攻防智能决策机制研究

Journal: Advances in Computer and Autonomous Intelligence Research DOI: 10.12238/acair.v3i2.13499

何俊

上海市信息网络有限公司

Abstract

强化学习因其在动态决策与自适应防御中的优势,已成为人工智能助力企业网络安全的重要研究方向。通过梳理现有技术的代表性研究与应用案例,如DQN、PPO等在仿真与小规模环境中的探索,分析强化学习在企业网络攻防中的应用现状及其面临的主要挑战,包括高维状态空间、实时性需求、数据稀缺等问题,结合最新研究进展,提出了一种综合性框架。该框架通过分层强化学习、多智能体协作与知识增强策略,针对企业网络中的复杂攻防场景进行优化设计,意图实现高效、可扩展的动态防御,为强化学习赋能企业网络安全提供理论参考。

Keywords

人工智能;强化学习;企业网络安全;多智能体

References

[1] WANG Wenhao,SUN dingyuanhao,JIANG feng,et al.Research and challenges of reinforcement learning in cyber defense decision-making for intranet security[J].Algorithms,2022,15(4):134.
[2] 张瑜,潘小明,LIUQingzhong.APT攻击与防御.清华大学学报(自然科学版),2017,57(11):1127-1133.
[3] 张蕾,崔勇,刘静,等.机器学习在网络空间安全研究中的应用[J].计算机学报,2018,41(9):1943-1975.
[4] 王伟.基于深度学习的网络流量分类及异常检测方法研究[D].合肥:中国科学技术大学,2018.
[5] 冯瑞佳,苟洋,张考,等.基于人工智能的网络安全技术与应用[J].网络安全技术与应用,2024(3):118-121.
[6] 刘全,翟建伟,章宗长,等.深度强化学习综述[J].计算机学报,2018,41(01):1-27.
[7] MNIHV,KAVUKCUOGLUK,SILVER D,et al.Human-level contr ol through deep reinforcement learning.[J].Nature,2015,518 (7540):529-533.
[8] 张振,黄炎焱,张永亮,等.基于近端策略优化的作战实体博弈对抗算法[J].南京理工大学学报,2021,45(01):77-83.
[9] Volodymyr Mnih,Adrià Puigdomènech Badia,Mehdi Mirza, et al.Asynchronous methods for deep reinforcement learning [J].CoRR,2016.
[10] 胡浩,赵昌军,刘璟,等.基于随机博弈与A3C深度强化学习的网络防御策略优选[J].指挥与控制学报,2024,10(1):47-58.

Copyright © 2025 何俊

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License