- 博客(5)
- 收藏
- 关注
原创 基于bs4库的HTML信息
代码实现: from bs4 import BeautifulSoup import requests url="https://www.bilibili.com/" r=requests.get(url) r.encoding=r.apparent_encoding soup = BeautifulSoup(r.text,"html.parser") #print(soup.a) for ...
2019-05-25 15:45:04 256
原创 基于bs4的HTML遍历
![HTML的基本格式 ](https://img-blog.csdnimg.cn/20190524204703327.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDg0OTg4Nw==,size_16,color...
2019-05-24 21:02:37 157
原创 BeautifulSoup基本操作
Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库. BeautifulSoup支持Python标准库中的HTML解析器,还支持一些第三方的解析器,下面是默认的 from bs4 import BeautifulSoup import requests url="https://www.baidu.com/?tn=80035161_1_dg" r=requ...
2019-05-24 17:01:52 289
原创 Response对象
‘’‘ import ruqests r=request.get(‘www.xxx.com’) ‘’’ request对象的属性: r.status_code:http请求的返回状态。 r.text:http: 响应内容的字符串格式,URL对应的页面内容。 r.encoding: 从http header中猜测响应内容的编码方式。 r.apparent_encoding: 从页面中分析出的响应内容...
2019-05-23 16:48:20 167
转载 Pandas的操作
Pandas的操作 df:任意的Pandas DataFrame对象 s:任意的Pandas Series对象 import pandas as pd import numpy as np 导入数据 pd.read_csv(filename):从CSV文件导入数据 pd.read_table(filename):从限定分隔符的文本文件导入数据 pd.read_excel(filename)...
2019-05-14 21:47:37 104
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人