爬虫
慎三。
一个没有感情的内存杀手 。
展开
-
爬虫 01
网络爬虫概述网络爬虫: 网络蜘蛛(网络机器人),用来抓去网络数据的程序 用python程序去模仿人去访问网站,模仿的越逼真越好爬取数据的目的: 通过有效的大量数据来分析市场走势、公司决策企业获取数据的方式: 1. 公司自有数据 2. 第三方数据平台购买(数据堂、贵阳大数据交易所) 3. 爬虫爬取数据 市场上没有或者价格太高,利用爬虫程序爬取python做爬虫优势: 请求模...原创 2019-10-06 22:25:22 · 367 阅读 · 0 评论 -
爬虫 02
正则解析1.数据的分类 1)结构化数据 特点: 有固定的格式, 如 HTML / XML / JSON 2)非结构化数据 如: 图片/ 音频 /视频 等这类数据一般都存储为二进制2.正则表达式模块(re) 1)使用流程 创建编译对象: p = re.compile("正则表达式") 对字符串进行匹配: r = p.match("str") 获取匹配结果: print(...原创 2019-10-10 23:15:13 · 278 阅读 · 0 评论 -
爬虫demo
1. 内涵段子2. 有道翻译3. 猫眼电影4.链家二手房原创 2019-10-11 00:31:44 · 340 阅读 · 0 评论