日本雅虎网站商品抓取:
java爬虫;jsoup;线程
根据scrab(条件)到code.js里的对应url网址抓取html代码。
根据tag与class找到对应元素抓取。(div.get(i)需做判断否则会报数组异常)。
hibernate底层set到数据库
后期与页面展示项目结合起来,通过定时器触发每24小时抓取
日本雅虎网站商品抓取:
java爬虫;jsoup;线程
根据scrab(条件)到code.js里的对应url网址抓取html代码。
根据tag与class找到对应元素抓取。(div.get(i)需做判断否则会报数组异常)。
hibernate底层set到数据库
后期与页面展示项目结合起来,通过定时器触发每24小时抓取