马化腾“正在撇清与​腾讯征信的关系”;惠普打印机偷偷回传数据;“家里的电视还在偷看你”...世界都怎么了?...

640?wx_fmt=gif
640?wx_fmt=jpeg
640?wx_fmt=jpeg

整理: 数据猿 Toby

数据猿官网 | www.datayuan.cn

640?wx_fmt=jpeg

今日头条丨一点资讯丨腾讯丨搜狐丨网易丨凤凰丨阿里UC大鱼丨新浪微博丨新浪看点丨百度百家丨博客中国丨趣头条丨腾讯云·云+社区

640?wx_fmt=png

【目录精要】在大兴机场乘坐东航,刷脸就可坐飞机;超8成网贷平台尚未接入百行征信;受监管收紧影响,和信贷最新财报净收入下滑90.5%;杭州将建立统计大数据应用中心;甘肃组建大数据技术应用协会;南方电网首次与科技企业共享部分实际运行数据;百度地图上线语音定制功能 基于其独创Meitron技术。

数据隐私

惠普打印机被发现偷偷回传数据

在打印机行业,惠普可以说是霸主级别的存在,但是软件工程师Robert Heaton近日却发现,惠普打印机会将部分用户数据回传给惠普,默认开启,而且隐藏相当深。

640?wx_fmt=jpeg

据发现,在惠普打印机的安装过程中,有一个很难为人注意的“数据搜集通知与设置”(Data Collection Notice & Settings),惠普在其中声明会尝试搜集用户的相关打印情况,并传回给惠普,目的是改善广告、用户体验。

但是,惠普故意将传回数据类型的选择隐藏了起来,如果不是特别细心、特别懂技术,几乎不可能发现,而且这个“功能”是默认开启的,等于几乎所有用户在使用惠普打印机的时候,都在无意中将自己的相关数据交给了惠普。

惠普打印机会搜集所有产生文档的应用的相关数据,基本上你打印的所有类型文档(txt/doc/jpg/pdf等等)、时间戳、文档体积、使用报告等等,都在其中。

惠普在隐私政策中也强调了,惠普不会扫描用户打印文档的具体内容,只是相关特性和规格。

当你看电视,电视也在“看”你

根据两项研究,我们的智能电视正在向Netflix、谷歌和Facebook等公司泄露敏感的用户数据,即使一些设备处于闲置状态。

来自美国东北大学和英国帝国理工学院的研究人员发现,三星、LG等厂商的智能电视,以及Roku TV和亚马逊Fire TV等流媒体机顶盒,都在向Netflix和第三方广告商发送位置和IP地址等数据。并且无论用户是否拥有Netflix帐户,数据都会被发送。

640?wx_fmt=jpeg

此外,包括扬声器和摄像头在内的其他智能设备正在向Spotify和微软等数十家第三方发送用户数据。

普林斯顿大学的另一项研究发现,Roku TV和Fire TV支持的一些应用程序正在向包括谷歌在内的第三方发送特定用户标识符等信息。

当下,智能设备正在涌入人们的生活,这些研究加剧了人们对用户隐私泄露的担忧。

著名的市场监测和数据分析公司Nielsen在今年3月的一份报告显示,截至2018年底,约68%的美国家庭拥有联网的电视设备,包括Roku TV和苹果的Apple TV等外接设备。这类设备使用内容识别技术,追踪你的使用记录,以便针对你精准投放广告。

东北大学的研究涉及英国和美国的81种不同设备。研究人员表示,亚马逊、谷歌、Akamai和微软是与智能设备联系最频繁的公司,部分原因是这些公司为智能设备提供云服务和网络服务。

东北大学的计算机科学家David Choffnes 说:“在我们的研究样本中,几乎一半都与亚马逊联通。这意味着亚马逊可以通过不同设备,推断出很多信息,比如你正在做什么等等,有些设备甚至不是亚马逊生产的。他们还能以此窥探到竞争对手的策略。”

通过对网络流量的分析,东北大学的研究小组得出结论,第三方至少可以知晓人们正在使用的设备,他们的位置,甚至可能是他们与设备交互的信息。也就是说,这些第三方能分析出你什么时候在家,什么时候不在家。

由于设备制造商发送的大部分数据都是加密的,研究人员并不清楚到底有哪些额外的数据在传输。帝国理工学院的Hamed Haddadi表示:“他们肯定能看到一些正在发生的事情,但具体是什么,要取决于制造商发送了什么。”

风暴中的各大互联网公司纷纷回应。

Netflix表示:“Netflix从未登录的智能电视接收到的信息,仅限于Netflix使用时屏幕的显示内容。我们没有收到任何关于智能电视上其他应用程序或活动的信息。”

Facebook表示:“设备和应用程序发送数据,给一些与之相关联的第三方服务商,这是很常见的。例如,某个应用程序向Facebook发送数据,来创建一个登录界面,或者提供一个Like按钮。”

谷歌表示:“根据设备制造商或应用程序所有者,发送到谷歌的数据可能包括用户位置、设备类型以及用户在特定应用程序中观看的内容,这样他们就可以通过个性化广告锁定目标。”

专家警告称,目前非常缺乏对智能设备存储和共享个人数据的监管。

牛津大学的计算机科学家Max Van Kleek 认为,人们把这些智能设备买回家中,花很多时间在上面,所以我们要对它们追究责任。“目前形势很严峻。”

墨迹天气、金山词霸等APP涉嫌超范围采集个人隐私,被公安部点名

近日,在公安部网络安全保卫局等主办的“2019年网络安全专题发布会”上,多款APP遭到“点名”。家校看板、蜜蜂优选、拨号大师等APP存在远程控制、恶意扣费等八大类恶意行为;果果分期、烈鸟APP被抓包检测出存在回传用户通讯录和短信的侵犯公民个人隐私行为;金山词霸、墨迹天气、分期宝等则涉嫌超范围采集公民个人隐私;NBA篮球大师、分钟天天红包等存在高危漏洞。

扇贝单词APP因“个人隐私问题”被网信办点名

近期,根据中国网信办等四部门提供的《关于开展App违法违规收集使用个人信息专项治理的公告》,扇贝单词因在收集个人信息方面存在问题被点名通报。

640?wx_fmt=png

扇贝单词,在线上教育浪潮中,曾因比较适应中国学生的学习习惯,而获得了大部分热爱英语的人的喜爱。然而用户在扇贝踌躇满志地刷单词时,可能已经忘了自己的通讯录、地理位置等信息已经泄露给商家。

征信

腾讯征信大换血:马化腾不再担任法人,卸任执行董事

据天眼查数据显示,马化腾日前不再担任腾讯征信公司法定代表人,同时卸任执行董事。

资料显示,腾讯征信公司成立于2015年3月17日,注册资本5000万元人民币,现任法定代表人,董事长为腾讯副总裁林海峰,郑浩剑任总经理。主营项目为机构用户提供信用信息支持;企业征信及相关业务等,深圳市腾讯计算机系统有限公司持股95%,深圳市世纪凯旋科技有限公司持股5%。

640?wx_fmt=jpeg

今年6月,林海峰晋升为腾讯公司副总裁,全面负责腾讯金融科技业务的管理与发展,腾讯金融科技旗下包括移动支付产品如乘车码、微信香港钱包、手机充值、信用卡还款、港菲汇款等;金融应用产品如腾讯理财通、腾讯自选股、腾讯微证券等;此外还有腾讯区块链、供应链金融等产品。

腾讯信用是腾讯征信推出的个人征信管理平台,主要基于历史行为信息,通过采集不同维度的信息,运用大数据,机器学习以及传统统计方法相结合的技术手段来客观的反映用户的信用水平,从而得出用户的守信指数,用信用分来反映用户的信用水平,分数多寡通过专业、先进的信用评分模型评估得出,分数越高代表信用水平越高。

去年1月31日,腾讯信用开放公测,与蚂蚁金服的芝麻信用玩法类似,腾讯信用分是基于微信与QQ互联网历史数据,通过“履约、安全、财富、消费、社交”五大维度,运用大数据等技术综合评估得出,最低300分,最高850分,然而该项服务仅被仅上线一天就被叫停,迄今仍未恢复。

超8成网贷平台尚未接入百行征信

记者近日从相关机构获得《关于加强P2P网贷领域征信体系建设的通知》,互金整治办和网贷整治办要求各省份互联网金融风险专项整治工作领导小组、网贷风险专项整治工作领导小组,组织辖区内在营的P2P网贷机构接入征信系统。记者了解到,目前已经接入百行征信的网贷平台占比仅占1成多。

据此前媒体报道,百行征信副总裁刘鹏鹏介绍,截至目前,百行征信接入服务协议机构达402家,培训接入机构200多家,接入征信系统报送数据机构165家,其中P2P网贷机构为101家。

从网贷之家发布8月份P2P网贷行业情况来看,截至2019年8月底,P2P网贷行业正常运营平台数量为707家,累计停业及问题平台数量达到了5914家。据扬子晚报记者了解,目前可查的接入百行征信的网贷机构包括人人贷、开鑫贷、宜人贷、和信贷、积木盒子、你我贷、小赢网金、搜易贷等。

受监管收紧影响,和信贷最新财报净收入下滑90.5%

9月19日,和信贷(HX.O)披露了2020财年第一季度财报。一季度和信贷净收入490万美元,同比下降90.5%;净亏损720万美元,同比由盈转亏,上年同期净利润为2970万美元。非美国准则下经调整后归属于公司股东净亏损700万美元,非美国准则下经调整后EBIT580万美元。

和信贷表示,业绩下滑主要由于监管收紧导致,同时公司实施了更严格的内控,包括通过第三方机构进行更严谨的信用背调来提升公司信用检测系统。

具体看来,公司解释称,(i) 行业政策收紧导致一些网络借贷平台的关停,从而造成出借人对于整个行业的信心受到负面影响,最终导致公司平台上可供投资的信贷产品的金额减少所致;(ii) 由于公司采取了更为严格的内部控制措施导致借款人数量下降,相关措施包括加强信贷背景调查以及与第三方信用报告机构进行合作,以进一步强化公司的信用核查系统。由于公司的收入主要来自促成借款成功后从借款人处收取的服务费,因此可供投资的信贷产品的金额和借款人数量的下降导致2020财年第一季度的收入减少。

政府相关

杭州将建立统计大数据应用中心

9月18日,国家统计局与浙江省人民政府在京签署《共建统计大数据应用中心合作协议》,共同在浙江省杭州市建立统计大数据应用中心,深度挖掘大数据价值,共享大数据开发应用成果。国家发展改革委副主任兼国家统计局局长、党组书记宁吉喆与浙江省委副书记、省长袁家军签署合作协议并分别致辞。

640?wx_fmt=jpeg

甘肃组建大数据技术应用协会

9月18日,“甘肃省大数据应用技术行业协会成立大会暨APEC中小企业云+创新创业论坛”在兰州举行。甘肃省委统战部副部长、省工商联党组书记、常务副主席赵少智表示,协会成立后将进一步整合甘肃大数据资源,推进云计算、大数据、人工智能、区块链等技术融合创新,提升中小企业发展层次,“助力甘肃在新一轮围绕信息产业资源配置的竞争中抢占制高点”。

会上披露,大数据应用技术行业协会是甘肃省组建的首个大数据领域的专业协会。协会将以国际标准技术为支撑,推动大数据实时分析、数据大脑等先进信息技术与产业应用在甘肃落地实施,推动大数据产业在甘肃各领域的深度融合,促进互联网、大数据、人工智能和实体经济的密切结合,打造国际标准地大数据产业技术应用高地。

企业动态

南方电网首次与科技企业共享部分实际运行数据

9月19日消息,在今天举行的南方电网公司2019年电网调度AI邀请赛上,南方电网首次与科技企业共享部分实际运行数据,探索人工智能技术与传统电网业务深入融合的路径。

本次竞赛通过从电网负荷这一典型业务入手,主要基于AI算法实现负荷预测,一方面展示人工智能融入电网业务的水平,同时也是人工智能技术改造传统作业的崭新尝试。南方电网公司积极落实国家创新战略,开展数字化转型。“云大物移智”具有多学科综合、高度复杂的特征,深度融合面临一定的技术瓶颈。

2017年,南方电网公司成立了CDAI创新工作室,并于今年向中国电机工程学会申报成立了“互联网+”电力系统自动化学科组,并倡议举办本次比赛。

此次AI邀请赛由南方电网电力调度控制中心、中国电机工程学会电力系统自动化专委会主办,“互联网+”电力系统自动化学科组负责,南方电网数字电网研究院有限公司、南方电网科学研究院有限责任公司和阿里云计算公司承办。

百度地图上线语音定制功能 基于其独创Meitron技术

9月19日,百度地图宣布上线语音定制功能,内部代号“百雀灵”。它是全球首个地图语音定制产品,每个用户都可以定制属于自己的个性化地图语音包。

据悉,用户在百度地图App上用手机录制20句话,合成制作约20分钟,就可以生成一套完整的地图语音包。

百度地图事业部总经理李莹介绍,所有百度地图上的语音播报的场景,都可以用到这个语音包,比如语音播报、与小度的互动等,“百度地图的工程师们内部叫它‘百雀灵’,百雀是大自然中各种鸟儿的总称,它们有各种美妙好听的声音,‘百雀灵’寓意着千千万万的用户,都能在百度地图录制自己的语音包,用自己独特的声音,向所爱的人表达关心与陪伴。”

随着语音定制功能的上线,百度地图“银河计划”也正式启动,首期邀请到华晨宇、秦岚等当红艺人参与个人语音包录制,成为百度地图“明星导航员”。

在技术层面,百度语音首席架构师贾磊表示,“百度地图语音定制功能基于百度独创的说话人韵律迁移技术Meitron,其特点主要体现在发音人音色转换,多情感朗读和韵律风格迁移三个方面,从而让个性化语音合成的定制门槛大大降低,相信百度语音技术在AI时代拥有无限可能。”

对于用户非常关心的音频数据安全问题,百度地图表示,百度地图对于语音定制服务的权限获取将仅用作语音包录制,不做他用。百度地图未经用户的授权同意,不会将用户的语音包共享给任何人。

在大兴机场乘坐东航,刷脸就可坐飞机

9月18日,东航联合华为公司、联通公司等在大兴机场正式推出基于5G网络的东航智慧出行集成服务系统。该系统综合运用“5G+AI”等技术,实现了从购票到登机全程刷脸等功能。

东航方面介绍,在即将启用的大兴机场,乘坐东航航班的旅客无需再像以往那样出示身份证、二维码。旅客只需要通过人脸识别,就可以完成从购票、值机、托运、安检、登机等各个出行流程。

同时,东航客舱乘务员可通过机舱口人脸识别系统进行旅客复验、旅客清点确认、座位引导等工作,有效提升服务精准度。

大兴机场开航后,搭乘国内航班的旅客可选择在大兴机场东航自助值机区和高端值机区的自助CUSS机进行一次性的人脸注册。在10月底航班换季后,东航APP亦可进行人脸数据采集操作。

此外,考虑到携带儿童和婴儿的旅客,东航为两周岁以上的儿童旅客提供“刷脸”系列服务,携带婴儿出行的旅客在刷脸办理值机后,系统会自动识别同行的婴儿旅客客票,在总人数会自动增加一个婴儿人数,无需旅客另行操作。

在大兴机场,通过配备的便携式人脸识别装置设备,东航地服人员可快速自动识别旅客,智能提醒旅客登机信息,避免旅客误机。

东航还在全球首发RFID(射频识别)永久行李牌基础上,与华为公司合作开发了5G行李跟踪解决方案,旅客可以随时在东航APP查询自己托运的行李状态。东航无源电子行李牌可反复使用,不易损坏,永久跟随旅客。

当旅客通过东航APP完成自助值机后选择行李托运,将电子行李牌贴近手机进行数据感应,几秒钟就能完成航班号、行李目的地等信息录入。随后,旅客前往专柜激活即可完成行李交付,真正实现全程“无纸化”。

相比传统柜台办理方式,无源电子行李牌的应用,让旅客出行变得更智慧、更便捷。东航地服工作人员也可以实时快速查询旅客行李,提升行李处理工作效率。

目前,东航已经开放第二批永久电子行李牌的申请,时间为9月20日至10月7日。旅客可通过最新版APP申领入口免费在线申请永久电子行李牌。

——END——

640?wx_fmt=jpeg
640?wx_fmt=jpeg
640?wx_fmt=jpeg

数据猿读者亲启:

名企&大佬专访精选

向下滑动启阅

以下文字均可点击阅读原文

跨国外企:

丨 丨

中国名企:

丨丨丨

知名学者:

创业明星:

丨丨丨夏粉丨丨丨

知名投资人:

——数据猿专访部

(可上下滑动启阅)

640?wx_fmt=png
640?wx_fmt=gif

▲向上滑动

采访/报道/投稿

640?wx_fmt=jpeg

yaphet.zhang@datayuan.cn

商务合作

640?wx_fmt=jpeg

18600591561(微信)

长按右方二维码

关注我们ˉ►

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
基于BERT构建新闻文本分类模型,并结合node.js + vue完成了一个可视化界面。 爬虫(Web Crawler)是一种自动化程序,用于从互联网上收集信息。其主要功能是访问网页、提取数据并存储,以便后续分析或展示。爬虫通常由搜索引擎、数据挖掘工具、监测系统等应用于网络数据抓取的场景。 爬虫的工作流程包括以下几个关键步骤: URL收集: 爬虫从一个或多个初始URL开始,递归或迭代地发现新的URL,构建一个URL队列。这些URL可以通过链接分析、站点地图、搜索引擎等方式获取。 请求网页: 爬虫使用HTTP或其他协议向目标URL发起请求,获取网页的HTML内容。这通常通过HTTP请求库实现,如Python中的Requests库。 解析内容: 爬虫对获取的HTML进行解析,提取有用的信息。常用的解析工具有正则表达式、XPath、Beautiful Soup等。这些工具帮助爬虫定位和提取目标数据,如文本、图片、链接等。 数据存储: 爬虫将提取的数据存储到数据库、文件或其他存储介质中,以备后续分析或展示。常用的存储形式包括关系数据库、NoSQL数据库、JSON文件等。 遵守规则: 为避免对网站造成过大负担或触发反爬虫机制,爬虫需要遵守网站的robots.txt协议,限制访问频率和深度,并模拟人类访问行为,如设置User-Agent。 反爬虫应对: 由于爬虫的存在,一些网站采取了反爬虫措施,如验证码、IP封锁等。爬虫工程师需要设计相应的策略来应对这些挑战。 爬虫在各个领域都有广泛的应用,包括搜索引擎索引、数据挖掘、价格监测、新闻聚合等。然而,使用爬虫需要遵守法律和伦理规范,尊重网站的使用政策,并确保对被访问网站的服务器负责。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值