爬虫学得好监狱进的早_爬虫,从入门到入狱?

176c8c52e22f59fb4b9cdd80942c34f7.png

自2019年9月以来,多家知名公司相关人员被抓或被调查,这些机构均涉及大数据风控业务和爬虫技术的应用。由此,大数据业务的合规合法问题、爬虫技术的合理应用问题,引起了大数据和金融科技行业的特别重视。

这样导致网上流传一个顺口溜:爬虫玩得好,监狱进得早。数据玩得溜,牢饭吃个够。

那什么是爬虫呢?爬虫技术到底违规吗?我在下面给大家介绍一下

1.什么是爬虫

爬虫,又称为网页支柱,网络机器人,在FOAF的社区中间,按照一定的规则,自动抓取万维网信息的程序。通俗的讲,在大数据时代,爬虫就是程序员高效获取信息的一种技术手段。

2.爬虫是合法还是非法?

爬虫也分善恶。爬虫本身作为一种技术,属于中立性质,本身不违法。非法与否关键在于利用爬虫技术所作何种行为。例如,针孔摄像头本身是一种合法中立的产品,但是有人偷偷将其安装在酒店客房偷拍客人隐私的行为,已经具有违法甚至是犯罪的性质。

3.生活中的爬虫有哪些?

像谷歌这样的搜索引擎爬虫,每隔几天对全网的网页扫一遍,供大家查阅,各个被扫的网站大都很开心。这种就被定义为善意爬虫。

但是,像抢票软件这样的爬虫,对着 12306 每秒钟恨不得撸几万次。铁总并不觉得很开心。这种就被定义为恶意爬虫。注意,抢票的你觉得开心没用,被扫描的网站觉得不开心,它就是恶意的。

4.爬虫的风险有哪些?

(1)违反被爬网站的意愿,强行突破反爬措施。

(2)干扰被爬网站的正常运营。

(3)获取了受法律保护的特定类型的数据和信息。

5.爬虫触犯的哪些刑事责任?

侵犯公民个人信息罪

(1)爬取的数据信息属于公民个人信息范畴

公民个人信息,是指以电子或者其他方式记录的,能够单独或者与其他信息结合识别特定自然人身份,或者反映特定自然人活动情况的各种信息,包括姓名、身份证件号码、通信通讯联系方式、住址、账号密码、财产状况、行踪轨迹等。

(2)利用爬虫技术获取的公民个人信息为非法获取的

利用爬虫技术收集公民个人信息数据,应当获得被收集人的同意,尤其是在数据中包含身份证号、信用信息等敏感数据的情况下,还需要获得明示同意。同时,利用网络漏洞非法下载、非法购买等行为,都属于"非法获取"公民个人信息。

(3)非法获取公民个人信息达到"情节严重"以上的标准

非法获取、出售或者提供行踪轨迹信息、通信内容、征信信息、财产信息五十条以上,非法获取、出售或者提供住宿信息、通信记录、健康生理信息、交易信息等其他可能影响人身、财产安全的公民个人信息五百条以上,非法获取、出售或者提供上述规定以外的公民个人信息五千条以上,都属于"情节严重"。

6831178d971d40561fe124bf18d5fb61.png

爬虫是一门技术,掌握的好,无疑可以利用这一工具更便捷高效的获得信息,但不可触碰法律红线,违法爬虫。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值