是谁在偷窥你的手机隐私?

640?wx_fmt=gif

640?wx_fmt=jpeg

一路上我都会发现从未想像过的东西,如果当初我没有勇气去尝试看来几乎不可能的事,如今我就还只是个牧羊人而已。——《牧羊少年的奇幻之旅》

640?wx_fmt=png 中国软件网每日精选文集



不知道从什么时候起,

小编发现手机App越来越懂自己了。

smiley_32.pngsmiley_32.pngsmiley_32.png

昨天才和家人打过电话说要买点面膜,做个精致女孩儿,今天上淘宝就看见了一连串面膜的推送和推荐搜索;刚在QQ和男朋友说周末要不一起去看个电影吧,切回小说阅读App就看到了热门电影的推荐广告;就在百度保存了几张萌宠的照片,打开抖音就看到了宠物粮的推荐;喜欢上一个明星,刷个微博就几乎从头到尾都是这个明星的相关。

640?wx_fmt=png


这样的广告充斥在小编的各种App内,甚至在看到截图的时候小编还能想到是为什么这个广告会出现在这个App。小编透过这些广告,看到了那个团购过电影票,在百度找过OA资料,在微信与友人评论过婚纱,帮父母参考过家电类购物的自己。

细思极恐啊喂!!!!

640?wx_fmt=png


这些App到底是怎么知道我想要什么的?

难道我的手机被监听,聊天被监控,

个人信息被泄露了?!

640?wx_fmt=png

No~No~No~No!


640?wx_fmt=jpeg


中国软件网 这是一条不正经的科普分割线


行为数据 让这些App知道了我们需要什么。

从注册这些App开始,它就拿到了我们的基础数据。像注册时需要的手机号,后续需要补充的姓名、性别、所在地的等信息,有些甚至需要补充更精细的个人信息。

640?wx_fmt=png


但这些只是微不足道的基础数据,更重要的是你的消费记录、浏览记录、出行记录、饮食记录、红包记录、搜索记录、理财习惯、贷款、保险等等行为数据。

640?wx_fmt=png


这些行为最后会变成几千个事实标签,成为你行为数据的一部分。

采集完你的事实标签之后,会对你建立模型,并从杂乱的模型中找到你真正感兴趣的,进而构建用户画像,精准的对你进行相关推送。(讲真,并不是很想要!)

640?wx_fmt=png

▲ 小编根据自己做了个大体示例

比如小编的用户画像里有常看电影这一条,那小编就更容易在各大App里面靠前的位置看见电影的相关推荐。

那,这样一个充满标签的“小编”

是怎么被构建出来的呢?

640?wx_fmt=png

小编打开了一篇标签为“西餐”的文章。

▼▼▼

但这并不意味着小编真的喜欢西餐,可能只是不小心点到了。这时,就需要通过更多的行为来判断这篇文章对小编的吸引力。

一个非常初级的内容标签权重算法:


 兴趣标签权重=

行为权重×访问时长×衰减因子 

行为权重对应小编是否有评论、点赞、收藏、转发等操作,不同的操作有不同的数值,累加成行为权重。

访问时长非常好懂,就是指小编在这篇文章停留时间越长,时间权重越高,小编对这篇文章越感兴趣。

衰减因子就是指,小编的短期行为也无法证明小编对这个有着长期兴趣,因此,单次阅读行为的权重会随着时间的流逝而逐渐衰减。

于是小编每次打开西餐的相关内容都会生成一个兴趣权重,把一段时间内小编所有的西餐兴趣权重进行累加(x),再用变形的S型函数进行标准化:

640?wx_fmt=png

▲ S型函数


640?wx_fmt=png


就能得到一个0~10区间的兴趣标签值,数值越高,小编对西餐就越感兴趣。

除了内容兴趣,这种算法思路也可以用在消费能力、消费兴趣、社交习惯等多个维度建立模型,计算你的偏好,之后,这些偏好会被转换为特征向量。

假设小编的西餐兴趣标签值是9,消费能力是5,社交偏好是2,就可以用特征向量表示为:Γ(9,5,2),这就是小编的代号了。

将这个特征向量想成一个坐标,把每一个用户的向量坐标带入余弦公式中,

640?wx_fmt=png

▲ 余弦公式

就能计算出和小编相似的人,就可以将所有人分成一类一类的用户,然后就能针对某一类用户进行精准推荐。

640?wx_fmt=png

▲ 被分成不同类的用户,你们猜猜哪个是小编~

但这些行为数据只能计算偏好,无法判断你的性别、学历等个人属性。这就需要把已知性别和学历的用户作为样本,一部分用来训练模型,一部分用来测试准确度。最后,App们就能得到一个更加准确的用户画像,广告主就可以找到他们想要的消费者了。


中国软件网 这是小编科普结束的分割线


什么?你说不注册不登录App

就可以避免被采集数据了?

640?wx_fmt=png

App们采集的行为数据,

不仅只对应你的账号,

更与你的手机唯一识别码绑定在一起。

640?wx_fmt=png


 锁死了! 

这意味着,你就算不注册不登录,你的行为数据一样会被采集。同时,广告平台也可以根据你的手机识别码在其他App上为你投放广告,你在刷抖音的时候也能看到淘宝的广告了。

当然,也别太紧张,根据《个人信息安全规范》,商业广告平台的所有标签,都应该避免精确定位到个人,以保护你的隐私安全。(意思就是,小编是Γ(9,5,2),而Γ(9,5,2)却不只是小编,它代表了一类人。)

其实,小编在搜集了很多资料之后发现,通过兴趣推荐商品的效果不如通过同类推荐商品,找到和你一样的人,把他们的浏览和消费记录推荐给你,往往比直接猜你喜欢什么效果更好,而现在很多App也确实是这么做的。

这些也就是为什么,你会慢慢觉得你的App们越来越懂你了~

P.S. 小编想对所有的App说,我一个星期都在百度搜索丧葬相关可能只是因为我想写一篇关于丧葬文化的文章,我不需要也不想看到,在这一周内各种App的推送也全是满屏的花圈,寿衣类物品,你们这是“不懂装懂”!令人窒息.jpg

640?wx_fmt=png



中国软件网 小编题外话


与上面的购买类精准推送不同的是,小编其实更早就察觉到了内容类推送的类似变化。作为一个媒体工作者,小编的日常也需要和各种各样的消息和新闻打交道,但越来越发现,我所接受到的新闻在慢慢同质化,在慢慢缩小范围,几乎固定在了我常搜索的领域。是的,很多App也开始对用户进行内容类的精准推送了。

举个栗子,最近大火的抖音,小编也下过一段时间,也曾经刷刷刷的就发现时间不见了。然后发现,我能刷到的都是我比较感兴趣的领域,像是萌宠,手工之类的,以至于有时候聊聊到说抖音比较火的什么什么,小编都是一脸雾水,咦?我怎么没看到过?难道我刷的是个假的抖音?

如果用一句话来概括我们原来接收到信息的模式,是“你看到的是你应该看的”,那么现在新兴的这种信息推送模式,就是“你看到的就是你喜欢看的”,诚然,这种模式会加大用户的停留时长,但小编并不喜欢这种模式。(所以有些App早就不在小编的手机里了~嘘~)

随着互联网的发展,我们获取信息的途径有了天翻地覆的变化,曾经我们用“地球村”来形容我们接收信息的速度和广度,足不出户就知天下事,而现在,这种广度正在被人为的降低。

以一位普通的在校大学生为例,Ta除了日常学习之外,可能还对音乐、娱乐等感兴趣,但在前几年,即便不特意关注,Ta在浏览新闻的时候,也会看到国家大事、时事政治、电影、文化之类新闻的推送,Ta可以选择自己想了解更多的进行了解,不是很感兴趣的扫一眼就过去了,但各个领域最近大概发生了什么事情,Ta都是知道的,只是了解的深浅不一样而已。但是现在,或许Ta浏览新闻获取外界消息的地方,已经没有其他Ta平时不太关注领域的新闻了,对,可能更多音乐、娱乐类的推送会让Ta在这个App上停留的时间更长,因为Ta每个都感兴趣,都想详细了解,但他本身获取到的消息丰富度正在降低。

大量的接收信息却并没有帮助我们拓宽视野,相反的,日常推送可能正一步一步把我们禁锢在一个小圈子内。

所以在最后,小编化用一句饭圈常用语来结束这篇文章叭,希望这些App们也能离我们用户的生活远一点~阿门~

640?wx_fmt=png

 

 小 福 利 

如果你是iphone用户,可以通过设置→隐私→广告→限制广告跟踪,来限制对你个人数据的采集哦~



640?wx_fmt=png— END—


用眼看世界,用心写故事

640?wx_fmt=jpeg 640?wx_fmt=jpeg 640?wx_fmt=jpeg 刘佩雯

个人微信:lz-3344-wb

工作邮箱:lpw@soft6.com

640?wx_fmt=png 640?wx_fmt=jpeg

www.soft6.com

中国软件网

长按扫码可关注


点击 阅读原文 报名参与CDEC 2019中国数字智能生态大会


640?wx_fmt=gif

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值