当前工作中遇到一些客户要求采集手机APP里面的内容,随着移动端的兴起,这方面的需求会越来越多,在当前的互联网环境下,移动端越来越受重视,从内容上就能看出来,移动端内容更加丰富,体验更好,网站端内容就没有那么丰富了,从这个角度能看出转义的趋势。
网站端的采集相对好做,至少从功能上讲是这样,功能是指将数据采集下来的能力,但是从性能上讲,网终端的采集也并不简单。为什么网站端实现数据采集功能相对容易呢,是因为网站内容我们是通过浏览器看的,而浏览器是一个公共的标准的平台,也就是说客户端没有发布内容企业自己的东西,有的仅仅是内容。那么我们就可以模拟浏览器进行肆无忌惮的采集,因为服务器没办法分辨出客户端是真正的浏览器访问还是采集网络爬虫。
如果在手机APP情况就完全不一样了,因为手机APP是企业自己发布的,所有的功能都是自己的,我们企业想防止采集就很容易了,在手机APP端加密,或做数据校验,在服务器端收到数据后最解密或数据验证,网络爬虫很难像网站采集那样模拟访问了,使用旧的采集方案,除非破解APP加密算法或校验算法,否则无解。
是不是手机APP就不能采集了呢,当然不是,还好我们找出了采集手机APP的方案
转载请注明出处 数荟集(专业数据提供) http://www.shuhuiji.com/detail.jsp?id=10