spider
听见下雨的声音hb
一期一会,IT人生
展开
-
spider-python (媒体信息的爬取)
环境搭建 selenium-3.8.1+python2.7+chromedriver 具体的搭建方式请百度 参考:http://blog.csdn.net/zxy987872674/article/details/53082896 媒体基础信息爬取实例 app-spider.py # coding: UTF-8 from selenium import webdriver im原创 2018-02-07 10:52:10 · 638 阅读 · 2 评论 -
spider-java (Jsoup) (媒体信息的爬取)
媒体基础信息爬取实例 GetAppname.java (代码为hive的udf,静态页面的获取) package com.hb.hive.utils; import java.util.Random; import org.apache.hadoop.hive.ql.exec.UDF; import org.apache.hadoop.io.Text; import org.jsoup.J原创 2018-02-07 11:30:26 · 662 阅读 · 1 评论