Python爬虫系列第一篇

偷偷学编程的小学生

已于 2022-02-02 16:56:29 修改

阅读量738

点赞数

文章标签：爬虫

于 2022-02-01 22:11:18 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ygsmdnh__/article/details/122760306

版权

十分抱歉，我因为过寒假没有及时更新，不过我会很快补回来的。

好，现在进入正题：

今天我们来爬一个网站的源代码，随便哪个网站，只要你知道网站网址即可。

开干！

一、环境搭建

俗话说：“磨刀不误砍柴工。”，木有一些扩展库，怎能去写爬虫呢？

1、首先，按下“WIN+R”，打开“运行”

2、然后，输入“cmd”

3、点“确定”，打开一个CUI

4、输入以下代码，点“Enter”：

pip install requests

5、等待下载……………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………

6、再输入以下代码，点“Enter”：

pip install bs4

7、再次等待……………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………

二、编写代码

1、打开编辑器

2、输入以下代码

import requests

html = requests.get("https://www.bilibili.com").read().encode('utf-8')

print(html)

3、运行

三、讲解

首先第一行:

import requests

导入requests模块，requests，就是联网的模块。

然后第二行，也是程序的中心：

html = requests.get("https://www.bilibili.com").read().encode('utf-8')

访问bilibili，并且读出源代码，转换成utf-8格式后存入html变量。

第三行就输出。

当然网址换成其他也行！

最后，祝大家新年快乐(*^▽^*)！

偷偷学编程的小学生

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python爬虫系列第一篇

爬虫第一站
复制链接

扫一扫

偷偷学编程的小学生 CSDN认证博客专家 CSDN认证企业博客

码龄3年

3: 原创

147万+: 周排名

216万+: 总排名

1440: 访问

: 等级

31: 积分

0: 粉丝

0: 获赞

0: 评论

0: 收藏

私信

关注

热门文章

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。