![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
米九
二十一
男
188
爱好女
展开
-
抓取东方财富网股票信息
举例目标网站 : 东方财富网 (排行) 沪深A股网站是使用Ajax异步加载 url: http://quote.eastmoney.com/center/gridlist.html#hs_a_board因为是Ajax异步加载 所以要找到包含数据的json接口包含数据json url : http://33.push2.eastmoney.com/api/qt/clist/get...原创 2019-12-25 19:58:38 · 4871 阅读 · 3 评论 -
爬取斗鱼弹幕数据
测试版 可用#!/usr/bin/env python3# _*_ coding: utf-8 _*_# Date: 2019/12/9 0009 18:59# Author: Mijiu# Version: 1.0import timefrom selenium import webdriverchrome_options = webdriver.ChromeOption...原创 2019-12-09 20:48:08 · 1069 阅读 · 3 评论 -
(爬虫基础)练习网站针对数据爬取
目标网址:http://www.caab.gov.bd/aip/amd/amd.html输入字符串,检索绿色标题检索到后,提取绿色标题对应的url及下载相应文件,并把绿色大标题下的小标题提取出来,同时提取小标题对应的url及下载相应文件。不属于同一绿色标题下的小题标题不要提取。import randomfrom selenium import webdriverfrom selenium...原创 2019-11-13 14:49:20 · 859 阅读 · 0 评论 -
(爬虫基础)爬取猫眼Top100电影
#!/usr/bin/env python3# _*_ coding: utf-8 _*_# Date: 2019/11/11 0011 12:40# Author: Mijiu# Version: 1.0import requests,re,csvfrom lxml import etree# 获取页面源码 (猫眼电影top100) by Rosny 2019-11-11de...原创 2019-11-13 14:43:49 · 381 阅读 · 0 评论