数据采集
文章平均质量分 83
crystal_tyan
沙漠的另一边会是什么,又一片沙漠罢了
展开
-
好以前写的一个java采集淘宝搜索页面商品数据的函数
用的是Jsoup static public void parsePage(Document doc) throws Exception { List list = new ArrayList(); Elements productview = doc.select("div.tb-content"); Element原创 2014-12-03 17:34:32 · 2747 阅读 · 0 评论 -
python数据采集百度知道
dom解析,用的是BeautifulSoup 还有小小的bug,因为百度知道的标签太混乱了 url还好,都是连续的http://zhidao.baidu.com/question/ + 问题的id def parseHtml(resultHtml,questionid): soup = BeautifulSoup(resultHtml) if( soup.fin原创 2014-12-03 17:17:48 · 1365 阅读 · 1 评论