学习笔记—Python网络爬虫（一）

最新推荐文章于 2020-12-19 23:08:43 发布

z小白

最新推荐文章于 2020-12-19 23:08:43 发布

阅读量1.2k

点赞数 2

分类专栏： python 文章标签：网络爬虫 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zzc15806/article/details/78357273

版权

一、网络资源（URLs）撷取套件。

可以使用REST操作（POST, PUT, GET, DELETE）存取网络资源。以新浪新闻网站为例：

import requests
res = requests.get('http://news.sina.com.cn/china/')
res.encoding = 'utf-8'
print(res.text)

二、BeautifulSoup4

2.1 将保存的网络资源转化为DOM Tree，可提取每个节点文字信息。

from bs4 import BeautifulSoup
html_sample = ' \
<html> \
<body> \
<h1 id='title'>Hello World</h1> \
<a href="#" class="link">This is link1</a> \
<a href="# link2" class="link">This is link2</a> \
</body> \
</html>'

soup = BeautifulSoup(html_sample, 'html.parser')
print(soup.text)

2.2 找出所有含有特定标签的HTML元素

2.2.1 使用

最低0.47元/天解锁文章

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
学习笔记—Python网络爬虫（一）

一、网络资源（URLs）撷取套件。可以使用REST操作（POST, PUT, GET, DELETE）存取网络资源。以新浪新闻网站为例：import requestsres = requests.get('http://news.sina.com.cn/china/')res.encoding = 'utf-8'print(res.text)二、BeautifulSou
复制链接

扫一扫

专栏目录

z小白 CSDN认证博客专家 CSDN认证企业博客

码龄8年

79: 原创

3万+: 周排名

214万+: 总排名

169万+: 访问

: 等级

8890: 积分

546: 粉丝

1128: 获赞

339: 评论

4296: 收藏

私信

关注

热门文章

分类专栏

深度学习 24篇
声音识别教程 12篇
Keras 7篇
TensorFlow 5篇
python 22篇
声音识别 13篇
机器学习 3篇
keras 19篇
人工智能 2篇
matlab 4篇
论文导读 2篇
深度学习 25篇
社会百态 1篇
杂七杂八 6篇
Ubuntu 5篇
PyTorch 2篇
数据结构与算法 2篇
爬虫 1篇
Java 1篇
声源定位 1篇

最新评论

1. 数据集准备和工具安装
IT123456ZXM: 博主你好，代码下载之后老报错，waveplot和logamplitude这两个找不到，请问博主能给出对应安装包的版本号吗其他运行成功的可以把自己安装包的版本号发一下吗
1. 数据集准备和工具安装
IT123456ZXM: 博主你好，代码下载之后老报错，waveplot和logamplitude这两个找不到，请问博主能给出对应安装包的版本号吗
Pytorch编译安装warp-CTC
m0_71516629: win10怎么弄啊
音频处理库—librosa的安装与使用
m0_59781092: 你好，我用pip安装librosa的时候报错failed with initial frozen solve. Retrying with flexible solve.该怎么解决呀
Jupyter Notebook 插入图片的几种方法
qq_53681920: 感谢大佬，可以插入了，很方便

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。