![176c8c52e22f59fb4b9cdd80942c34f7.png](https://img-blog.csdnimg.cn/img_convert/176c8c52e22f59fb4b9cdd80942c34f7.png)
自2019年9月以来,多家知名公司相关人员被抓或被调查,这些机构均涉及大数据风控业务和爬虫技术的应用。由此,大数据业务的合规合法问题、爬虫技术的合理应用问题,引起了大数据和金融科技行业的特别重视。
这样导致网上流传一个顺口溜:爬虫玩得好,监狱进得早。数据玩得溜,牢饭吃个够。
那什么是爬虫呢?爬虫技术到底违规吗?我在下面给大家介绍一下
1.什么是爬虫
爬虫,又称为网页支柱,网络机器人,在FOAF的社区中间,按照一定的规则,自动抓取万维网信息的程序。通俗的讲,在大数据时代,爬虫就是程序员高效获取信息的一种技术手段。
2.爬虫是合法还是非法?
爬虫也分善恶。爬虫本身作为一种技术,属于中立性质,本身不违法。非法与否关键在于利用爬虫技术所作何种行为。例如,针孔摄像头本身是一种合法中立的产品,但是有人偷偷将其安装在酒店客房偷拍客人隐私的行为,已经具有违法甚至是犯罪的性质。
3.生活中的爬虫有哪些?
像谷歌这样的搜索引擎爬虫,每隔几天对全网的网页扫一遍,供大家查阅,各个被扫的网站大都很开心。这种就被定义为善意爬虫。
但是,像抢票软件这样的爬虫,对着 12306 每秒钟恨不得撸几万次。铁总并不觉得很开心。这种就被定义为恶意爬虫。注意,抢票的你觉得开心没用,被扫描的网站觉得不开心,它就是恶意的。
4.爬虫的风险有哪些?
(1)违反被爬网站的意愿,强行突破反爬措施。
(2)干扰被爬网站的正常运营。
(3)获取了受法律保护的特定类型的数据和信息。
5.爬虫触犯的哪些刑事责任?
侵犯公民个人信息罪
(1)爬取的数据信息属于公民个人信息范畴
公民个人信息,是指以电子或者其他方式记录的,能够单独或者与其他信息结合识别特定自然人身份,或者反映特定自然人活动情况的各种信息,包括姓名、身份证件号码、通信通讯联系方式、住址、账号密码、财产状况、行踪轨迹等。
(2)利用爬虫技术获取的公民个人信息为非法获取的
利用爬虫技术收集公民个人信息数据,应当获得被收集人的同意,尤其是在数据中包含身份证号、信用信息等敏感数据的情况下,还需要获得明示同意。同时,利用网络漏洞非法下载、非法购买等行为,都属于"非法获取"公民个人信息。
(3)非法获取公民个人信息达到"情节严重"以上的标准
非法获取、出售或者提供行踪轨迹信息、通信内容、征信信息、财产信息五十条以上,非法获取、出售或者提供住宿信息、通信记录、健康生理信息、交易信息等其他可能影响人身、财产安全的公民个人信息五百条以上,非法获取、出售或者提供上述规定以外的公民个人信息五千条以上,都属于"情节严重"。
![6831178d971d40561fe124bf18d5fb61.png](https://img-blog.csdnimg.cn/img_convert/6831178d971d40561fe124bf18d5fb61.png)
爬虫是一门技术,掌握的好,无疑可以利用这一工具更便捷高效的获得信息,但不可触碰法律红线,违法爬虫。