day06

最新推荐文章于 2024-11-13 17:25:30 发布

aolai7212

最新推荐文章于 2024-11-13 17:25:30 发布

阅读量66

点赞数

文章标签：爬虫 json python

原文链接：http://www.cnblogs.com/maqiaobin/p/11425832.html

版权

回顾

什么是文件

操作系统提供的虚拟单位

文件打开的步骤

获得路径 file_path
打开文件 open
读取/修改文件
保存
关闭

打开文件的3个模式和2种方式

‘r’ 只读不可写
'w' 只写不可读（清空后再写）
'a' 只写不可读（追加）
t模式（文本）
b模式（二进制）

with管理上下文

with open('文件名'，'模式')as f:
    f.read()

爬虫原理

通过浏览器发送请求获数据；通过requests模拟浏览器发送请求拿到内容

爬虫流程

发送请求（获得url）
获取内容
解析内容获得需要的内容

request模块的使用

import request
res=requests(
        url=''
)
#文本
res.text 
#二进制
res.content

re模块

re.s 全局搜索
re.findall 从内容中筛选所需要的内容
.*? 贪婪匹配  需要什么东西就把什么东西（.*?）

今日所学

if判断

单分支结构
if 条件：
    print（满足条件怎样怎样）

双分支结构
if 条件：
    print（满足条件怎样怎样）
else：
    print（不满足条件怎样怎样）
    
多分支结构
if 条件:
    print('条件成立干嘛干嘛')  # 条件成立才会执行该段代码，不成立不执行该段代码
elif 条件:
    print('if条件不成立走这条')
elif 条件：
    ...
else:
    print('条件不成立干嘛干嘛）# 条件不成立才会执行该段代码，成立不执行该段代码