前几天分享的一篇《只因写了一段爬虫,公司200多人被抓!》相信大家看了后都会发问,我只是个写爬虫的,跟我有什么关系?到底什么样的爬虫才不犯法?今天这篇会解答你所有的疑问。
作者:技术领导力
前几天分享的一篇爬虫被抓相信大家看了后都会发问,我只是个写爬虫的,跟我有什么关系?到底什么样的爬虫才不犯法?今天这篇会解答你所有的疑问。
图片来自 Pexels
“你交代一下,总共抓了多少数据,在哪些网站抓的,数据干什么用了?看看够在里面呆几年。。。”警察语气凝重地对张强说。
程序员张强(化名),回忆起这两天来的经历,仍心有余悸。
张强,在一家大数据风控公司担任爬虫工程师,每当看到网上的段子,爬虫学得好,监狱进得早,他总是莞尔一笑,心想:关我毛事啊,我只是个程序员,要坐牢也是老板去坐吧,我又没拿数据去卖钱。
时间回到 9 月,某一天的上午,张强和同事们像往常一样上班,突然公司里来了一群警察,要求所有人双手离开电脑、手机等设备,全部靠墙站立,工程师小哥哥、小姐姐们哪里见过这个架势,都懵了,只得照办。
警察查封了公司,带走了公司所有人,于是有了前面的问话。
01.我只是个写爬虫的,跟我有什么关系?
许多程序员都有这样的想法,技术是无罪的,我只是个打工的程序员,公司干违法的业务,跟我没关系。。。只能说,程序猿们真是图羊图森破了。
我们先来看几个真实的法院判决案例:
案例一:数据拥有者有证据能够举证你的数据是抓取来的。如下,今日头条起诉上海晟品的法院宣判结果。
图片文字来自中国判决文书网
从文书描述来看,修改 UA、修改 device id、绕开网站访问频率控制这是写爬虫的基本,这些技术手法反而成了获罪的依据。
案例二:抓取用户社交数据,尤其是用户隐私相关。