5个大数据分析中的隐私问题

文章讨论了大数据环境下数据输入阶段的隐私问题,不可信云服务提供商可能带来的风险,数据消费者获取隐私数据的可能性,以及数据屏蔽的局限性和大数据分析的准确性问题。强调了隐私安全在商业使用中的重要性,并指出需要不断升级技术来应对这些挑战。
摘要由CSDN通过智能技术生成

1. 数据输入阶段的原始数据隐私可能泄露

在数据输入阶段如果对敏感信息不采取标记和去隐私处理,那么有关个体的私人信息可能会被服务商窃取,就会造成输入阶段隐私泄露。

2. 云服务提供商鱼龙混杂不可信

为了扩展云服务器产品的推广和销售,服务提供商常提供一些免费的云服务器试用,可能在这一阶段服务商已获取用户信息。不可信的服务提供商可能会篡改用户数据或为用户提供虚假服务,例如恶意的搜索引擎会给用户返回错误的、含有恶意文件的搜索结果。服务质量在选择时难以评判。

3. 数据消费者往往可以获取到隐私数据

数据消费者端经过数据所有者授权,对数据具有使用权。他们可以直接访问部署在云平台的服务,也可以向云平台提交自编程的应用程序请求计算服务。比如个性化服务场景,用户允许服务提供商收集个人信息,以获取更精准的推荐服务等。这时他们可能可以推断出隐私数据,或以个人行为引起隐私泄露。

4. 多种可获取数据的渠道使屏蔽数据也会泄露个人信息

如果数据屏蔽没有得到恰当的使用,大数据分析很容易揭示数据被掩盖的实际个体。例如90年代中发生再美国马赛诸塞州的隐私泄露事件,破解者利用未被屏蔽的关键字段,加上其他有效资源成功匹配出了数据。

5. 大数据分析并非100%准确

如果使用的原始数据不准确、数据模型不准确、或算法存在缺陷,那么就会造成大数据分析的预测和结论并非完全准确。这样的情况下大数据可能会做出错误或不适当的判断、甚至对使用者造成伤害。比如拒绝为使用者提供某项服务、误诊、或标签化个人。

基于以上,首先在商业使用中,必须将隐私安全纳入流程;也需要不断升级技术途径进行计算或抵抗攻击。

参考文献:

大数据环境下的隐私保护技术. 中国网信网.

Rebecca Herold. 大数据分析所面临的10个最重要的隐私风险. 腾讯云.

钱文君,沈晴霓,吴鹏飞,董春涛,吴中海. 大数据计算环境下的隐私保护技术研究进展[J]. 计算机学报.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值