我觉得网页数据采集是一个不道德的行为,但是我喜欢。下面就说说我为什么喜欢。
某一天,小编看到喜欢的网页,很欣赏这个原创作者的作品,但由于小编穷,没法开通vip去下载资源,所以小编就运用一些网络技术进行网页数据采集,一不小心就采集下来了。
采集只是采集了静态页面和图片,深度采集可以采集其css和js。
原创作者肯定讨厌小编了。。。
源文件的:
采集后的:
采集后可对数据进行整理,如批量修改其名称,可观看这篇文章:
http://blog.csdn.net/sinat_15153911/article/details/72625959
原创作品应该得到尊重的,尊重的前提是交一些马路费。如想获取java研发网页数据采集的java源代码,这个采集是用java做的,可以加QQ490647751获取。
全CSDN的丰(好)色(se)博客,这里有书本看不到的Java技术,电影院禁播的电影,欢迎关注QQ群494808400