![](https://img-blog.csdnimg.cn/20191005140615674.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224)
爬虫
戎码关山
你在炫耀诗和远方,父母却尚在苟且
展开
-
python爬虫初步
目录入门知识爬虫步骤下载一部小说 入门知识 爬虫 一段模拟浏览器自动浏览网页、自动的批量的采集需要资源的程序(一个脚本) 本质是脚本伪装成浏览器向服务器申请资源回应 步骤 下载一个网页的demo url:统一资源定位符 python3 模块:requests(第三方库) import requests # 指定网页 url = 'https://2.python-requests.org//zh_...原创 2019-09-04 10:06:08 · 170 阅读 · 0 评论 -
scrapy
目录创建项目:启动项目提取数据的方法 创建项目: scrapy startproject project-name 启动项目 scrapy genspider spider-name+域名(如baidu.com) 提取数据的方法 1、正则表达式(必会) 2、XPath–>从html中提取数据 3、CSS 原理一样,只是语法不同 ...原创 2019-09-11 06:50:19 · 182 阅读 · 0 评论