无
无
序号 | 学生 | 所属学院 | 专业 | 年级 | 项目中的分工 | 成员类型 |
---|---|---|---|---|---|---|
|
孙玉涵 | 理学院 | 信息与计算科学 | 2022 | 负责项目整体规划、协调、管理和开发。 确定研究方向、目标和计划。 实现技术应用。 |
|
|
侯随鹏 | 理学院 | 信息与计算科学 | 2022 | 负责技术研究。 深入研究差分隐私技术。 提出新解决方案。 |
|
|
赵杰 | 理学院 | 信息与计算科学 | 2022 | 负责数据分析。 收集、整理和分析相关数据。 验证解决方案在实际应用中的效果 |
|
序号 | 教师姓名 | 所属学院 | 是否企业导师 | 教师类型 |
---|---|---|---|---|
|
野金花 | 理学院 | 否 |
|
1、深入理解差分隐私的基本原理和数学模型。通过分析不同差分隐私技术(如Laplace机制、Exponential机制等)的优缺点和适用场景,来研究差分隐私技术在不同领域的应用案例和最佳实践。旨在通过理论创新在差分隐私技术领域进行创新,提出新的理论模型、机制或应用方法。
3、分析当前数据泄露和隐私侵犯的主要方式和途径。识别不同行业和应用场景下的数据安全需求和挑战,并制定针对不同行业和应用场景的数据安全标准和规范。希望提出新的数据安全分析框架、风险评估方法,或者制定更具体、更有针对性的行业数据安全规范。
4、将差分隐私技术应用于实际的数据安全解决方案中,设计并实现包括数据预处理、隐私保护算法实现、数据分析结果发布等环节在内的完整流程。通过差分隐私技术来保护数据的隐私,同时保持数据的可用性,以满足不同行业和应用场景下的数据分析需求。
近年来,随着隐私数据保护意识的增强,差分隐私模型因其独特优势成为了隐私数据保护模式中的首选方法。差分隐私的研究主要聚焦于如何在确保隐私安全的同时,提供可发布的数据或准确的查询结果。
根据查询与原始数据交互方式的不同,差分隐私的保护策略可分为交互式和非交互式两种。在非交互式保护模式下,研究者们专注于设计更加高效的数据发布算法。这些算法在满足差分隐私要求的前提下,通过优化算法设计,提高了发布数据的可用性,使得发布后的数据能够更好地满足实际应用的需求。然而,在处理高维数据时,由于数据量和状态空间的庞大,直接应用差分隐私方法会面临诸多挑战。高维数据的复杂性使得传统的差分隐私保护策略难以直接应用。因此,如何针对高维数据的特性,实现高效、准确的差分隐私保护,成为了当前研究的重要方向。
Li等人[1]开发了DPSynthesizer,一个专注于差异私有数据合成的工具包。允许用户可以对合成数据进行采样,并利用一维边际分布来构建多元联合分布。Peiqian Liu等人[2]提出个性化轨迹隐私保护方案(DP_SR),结合TF-IDF设计个性化噪声保护敏感数据,构建RTF-tree实现整体数据安全。Li等人[3]的研究则聚焦于改进主成分分析(PCA)算法。通过引入属性重要性的概念,对PCA算法进行了优化,并通过这种改进的PCA算法降低了数据的维度,从而显著减少了时间和空间成本。Wang等人[4] 提出了结合分组和截断技术的高维数据发布方法,优化了信噪比。同样地,Xu等人[5]也提出了一种名为DPPro的算法,这是一种差异私有算法,通过随机投影发布高维数据,兼顾效用与隐私。Zheng等人[6]的研究则关注于压缩感知机制(CSM)。他们在压缩感知(CS)框架的基础上,开发了一种新的机制,该机制能够强制执行差分隐私,并为线性查询提供准确的结果。张少波等人[7]提出一种基于本地差分隐私的K-modes聚类方法,无需第三方参与,通过随机采样和扰动保护数据隐私,并通过迭代完成聚类。最后,李帅等人[8]针对差分隐私下单一聚类算法不足,提出基于Stacking集成和差分隐私的聚类算法。采用自适应ε函数添加Laplace噪声以保护隐私。该方法在提高聚类准确性的同时,满足了差分隐私保护要求,实现了隐私与数据使用的平衡。
由此可见,差分隐私技术作为核心的理论方法,已经得到了广泛的认可和研究。它通过在数据中添加噪声或扰动来混淆个体的信息,确保个人隐私在数据分析中不被泄露,同时保持数据的整体可用性。这一理论方法不仅在数学上具有严格的定义和证明,而且在实践中也表现出了良好的性能。例如,邬忠萍等人[9]通过拉普拉斯机制实现差分隐私,利用逐层相关传播(LRP)技术管理数据扰动,在保护隐私的同时保持模型准确度。刘浪等人[10]基于Wi-Fi指纹定位和RAPPOR算法,提出了一种本地差分隐私保护方案,利用Wi-Fi信号特征划分室内区域,通过RAPPOR算法处理用户数据并产生扰动向量,安全发送给服务器。张东月等人[11]建立了服务器与终端的循环反馈机制,提出一种基于LDP的隐私保护网格聚类方法。通过调整网格粒度,可以优化了扰动粒度,减少了噪声注入,保护数据隐私的同时并提高估算精度,从而平衡估算误差和信息损失。李明娟等人[12]针对僵尸用户导致的微博数据造假和现有DPC算法存在隐私泄露和检测不准确的问题,提出一种结合差分隐私和近邻优化的检测方法。该方法使用差分隐私添加Laplace噪声保护隐私,同时利用反向k近邻重新定义密度,提升在非均匀数据中的检测准确率。戴小凤等人[13]通过差分隐私和强化学习,实现了会计数据的动态隐私发布,借助区块链技术,构建了数据安全共享模型,实现高效且安全的财务数据共享。而何源等人[14]针对网络侦察的指纹探测威胁,提出差分隐私网络欺骗混淆机制(DPOF)。该机制基于数据隐私保护原理,构建效用驱动的混淆模型,并利用差分隐私指数机制确定混淆概率。在资源限制下,通过粒子群优化算法实现混淆策略的高效求解。
尽管差分隐私技术在理论和应用上都表现出了良好的性能,但在实际项目中仍然存在一些不足:差分隐私技术中的噪声添加量直接影响了隐私保护的程度和数据的可用性。过多的噪声会破坏数据的原始结构和信息,降低其分析价值;而过少的噪声则可能无法提供足够的隐私保护。如何平衡隐私保护与数据有效性和可用性,以及在保证隐私保护效果的同时降低实现复杂度,是一个需要研究的课题。
针对以上不足,本项目未来将重点开展以下工作:研究新的差分隐私技术和算法,探索在保护隐私的同时提高数据可用性的方法。例如,可以通过优化噪声添加策略和参数设置,来平衡隐私保护和数据效用之间的关系。或者利用云计算和分布式计算等技术来加速差分隐私算法的计算过程,研究更高效的差分隐私算法和计算框架,降低项目的实现难度和成本。
[4] Wang N, Gu Y, Xu J, et al. Differentially private
high-dimensional data publication via grouping and truncating techniques[J].
Frontiers of Computer Science, 2019, 13(2): 382-395
[5] Xu C, Ren J, Zhang Y, et al. DPPro:
Differentially private high-dimensional data release via random projection[J].
IEEE Transactions on Information Forensics and Security, 2017, 12(12):
3081-3093.
[6] Zheng Z, Wang T, Wen J, et al. Differentially private high-dimensional
data publication in internet of things[J]. IEEE Internet of Things Journal,
2019, 7(4): 2640-2650.
[7] 张少波, 原刘杰, 毛新军, 朱更明. 基于本地差分隐私的K-modes聚类数据隐私保护方法[J]. 电子学报, 2022, 50 (09): 2181-2188.
[8] 李帅, 常锦才, 李吕牧之, 蔡昆杰. 基于差分隐私保护的Stacking集成聚类算法研究[J]. 计算机工程与科学, 2022, 44 (08): 1402-1408.
[9] 邬忠萍, 郝宗波, 王文静, 刘冬. 结合联邦学习和增强学习的车联网数据差分隐私保护[J].
汽车技术,
2023, (11): 56-62.
[10]
刘浪, 蔡利平, 何文涛, 周绪川. 基于本地差分隐私的Wi-Fi指纹定位隐私保护方法[J]. 西南民族大学学报(自然科学版), 2023, 49 (05): 537-542.
[11]
张东月 , 倪巍伟 , 张森 , 付楠 , 候立贺 . 一种基于本地化差分隐私的网格聚类方法[J].
计算机学报,
2023, 46 (02): 422-435.
[12]
李明娟, 朱焱, 李春平. 基于差分隐私保护和近邻优化的微博僵尸用户检测[J].
计算机应用与软件,
2022, 39 (05): 54-59.
[13]
戴小凤, 朱卫东. 基于差分隐私的企业财务会计数据安全共享方法研究[J].
通化师范学院学报,
2023, 44 (04): 88-94.
[14] 何源, 邢长友, 张国敏, 宋丽华, 余航. 面向网络侦察欺骗的差分隐私指纹混淆机制[J]. 计算机科学, 2022, 49 (11): 351-359.
创新点:传统的差分隐私技术主要关注单一数据源的隐私保护。本项目将探索多源数据融合场景下的差分隐私保护技术,确保在多个数据源共享数据时,仍然能够有效保护个体隐私,并提高数据分析的全面性和准确性。针对差分隐私技术的核心算法进行优化,通过改进噪声添加机制和扰动方法,提高数据处理的效率和准确性。这将使得在保护个人隐私的同时,更好地保持数据的可用性和分析结果的准确性。
项目特色:本项目将多个学科进行融合,注重实践应用,所研发的差分隐私技术将具有良好的可扩展性和通用性。无论是在数据处理流程的不同阶段,还是在不同的数据应用场景中,都能够方便地集成和应用本项目所研发的差分隐私技术。
待解决的问题:针对特定应用场景,优化现有算法,以提高数据隐私保护的效果和数据分析的效用,使得在保护个人隐私的同时,更好地保持数据的可用性和分析结果的准确性。采用的主要方法是调整隐私预算ε、改进噪声添加机制、结合其他隐私保护技术等。
1)性能评估:设计合理的性能度量指标,用于评估不同差分隐私算法在隐私保护效果和数据分析效用之间的权衡。包括收集评估指标,如隐私泄露风险、数据误差率等,以量化算法的表现。
项目预期成果
1、发表1篇论文,指导学生撰写学位论文
2、优化现有算法,这些算法能够在保护数据隐私的同时,维持或提高数据分析的准确性和效率。
3、提供安全性分析报告和风险评估报告,为实际应用提供安全指导和建议。1、2024.06-2024.08,收集国内外关于差分隐私技术的最新研究资料,了解技术发展现状和趋势,并对收集到的资料进行系统的整理和分析,基于前期调研和分析结果,明确技术在实际应用中的需求和挑战,确定项目的技术路线和研发重点。
2、2024.09-2024.12,设计符合项目需求的差分隐私算法框架,对算法进行初步实现和测试,验证其可行性和性能,根据测试结果对算法进行优化和改进,探索多源数据融合场景下的差分隐私保护技术,提高数据处理的全面性和准确性。
3、2025.01-2025.04,设计数据处理系统的整体架构,在不同数据集和应用场景下对系统进行测试,验证其性能和稳定性,根据测试结果,对系统进行优化和调试。
开支科目 | 预算经费(元) | 主要用途 | 阶段下达经费计划(元) | |
---|---|---|---|---|
前半阶段 | 后半阶段 | |||
预算经费总额 | 10000.00 | 无 | 4000.00 | 6000.00 |
1. 业务费 | 7000.00 | 无 | 2500.00 | 4500.00 |
(1)计算、分析、测试费 | 0.00 | 无 | 0.00 | 0.00 |
(2)能源动力费 | 0.00 | 无 | 0.00 | 0.00 |
(3)会议、差旅费 | 0.00 | 无 | 0.00 | 0.00 |
(4)文献检索费 | 1000.00 | 文献检索 | 500.00 | 500.00 |
(5)论文出版费 | 6000.00 | 用于发表论文,申请专利、著作权等 | 2000.00 | 4000.00 |
2. 仪器设备购置费 | 2000.00 | 用于购买服务器、存储设备及网络安全设备等 | 1000.00 | 1000.00 |
3. 实验装置试制费 | 0.00 | 无 | 0.00 | 0.00 |
4. 材料费 | 1000.00 | 复印、打印相关资料,测试数据集等 | 500.00 | 500.00 |