- 博客(5)
- 收藏
- 关注
原创 基于bs4库的HTML信息
代码实现:from bs4 import BeautifulSoupimport requestsurl="https://www.bilibili.com/"r=requests.get(url)r.encoding=r.apparent_encodingsoup = BeautifulSoup(r.text,"html.parser")#print(soup.a)for ...
2019-05-25 15:45:04 277
原创 基于bs4的HTML遍历
![HTML的基本格式](https://img-blog.csdnimg.cn/20190524204703327.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDg0OTg4Nw==,size_16,color...
2019-05-24 21:02:37 173
原创 BeautifulSoup基本操作
Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.BeautifulSoup支持Python标准库中的HTML解析器,还支持一些第三方的解析器,下面是默认的from bs4 import BeautifulSoupimport requestsurl="https://www.baidu.com/?tn=80035161_1_dg"r=requ...
2019-05-24 17:01:52 306
原创 Response对象
‘’‘import ruqestsr=request.get(‘www.xxx.com’)‘’’request对象的属性:r.status_code:http请求的返回状态。r.text:http: 响应内容的字符串格式,URL对应的页面内容。r.encoding: 从http header中猜测响应内容的编码方式。r.apparent_encoding: 从页面中分析出的响应内容...
2019-05-23 16:48:20 184
转载 Pandas的操作
Pandas的操作df:任意的Pandas DataFrame对象s:任意的Pandas Series对象import pandas as pdimport numpy as np导入数据pd.read_csv(filename):从CSV文件导入数据pd.read_table(filename):从限定分隔符的文本文件导入数据pd.read_excel(filename)...
2019-05-14 21:47:37 126
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人