Ray7J-CSDN博客

原创基于bs4库的HTML信息

代码实现：from bs4 import BeautifulSoupimport requestsurl="https://www.bilibili.com/"r=requests.get(url)r.encoding=r.apparent_encodingsoup = BeautifulSoup(r.text,"html.parser")#print(soup.a)for ...

2019-05-25 15:45:04 277

![HTML的基本格式](https://img-blog.csdnimg.cn/20190524204703327.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDg0OTg4Nw==,size_16,color...

2019-05-24 21:02:37 173

原创 BeautifulSoup基本操作

Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.BeautifulSoup支持Python标准库中的HTML解析器,还支持一些第三方的解析器，下面是默认的from bs4 import BeautifulSoupimport requestsurl="https://www.baidu.com/?tn=80035161_1_dg"r=requ...

2019-05-24 17:01:52 306

原创 Response对象

‘’‘import ruqestsr=request.get(‘www.xxx.com’)‘’’request对象的属性：r.status_code:http请求的返回状态。r.text:http: 响应内容的字符串格式，URL对应的页面内容。r.encoding: 从http header中猜测响应内容的编码方式。r.apparent_encoding: 从页面中分析出的响应内容...

2019-05-23 16:48:20 184

转载 Pandas的操作

Pandas的操作df：任意的Pandas DataFrame对象s：任意的Pandas Series对象import pandas as pdimport numpy as np导入数据pd.read_csv(filename)：从CSV文件导入数据pd.read_table(filename)：从限定分隔符的文本文件导入数据pd.read_excel(filename)...

2019-05-14 21:47:37 126

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

weixin_44849887的博客

原创基于bs4库的HTML信息

原创基于bs4的HTML遍历

原创 BeautifulSoup基本操作

原创 Response对象

转载 Pandas的操作

空空如也

空空如也

原创 基于bs4库的HTML信息

原创 基于bs4的HTML遍历

原创 BeautifulSoup基本操作

原创 Response对象

转载 Pandas的操作

空空如也

空空如也

原创基于bs4库的HTML信息

原创基于bs4的HTML遍历