python小爬虫

本文介绍了如何在Windows 11上下载Python 3.9.9并检查系统位数,以及如何通过PyCharm安装requests库。在遇到下载速度慢的问题时,推荐使用清华源。此外,还讨论了爬虫中可能出现的乱码问题,解决方案是设置响应的encoding属性为网页的charset值。
摘要由CSDN通过智能技术生成

准备工作

python版本是3.9.9,需要下载requests第三方库,运行环境是Pycharm,最新版本的那个,系统:win11
在命令行种输入pip install requests ,速度可能有点慢,如果你出现TimeOut的错误,就换这个Pip install -I https://pypi.tuna.tsinghua.edu.cn/simple package-name
清华源

下载python(3.9.9)

在这里插入图片描述
点进去有点慢,毕竟是国外的
在这里插入图片描述

你电脑是什么样的就点击那个就行,直接下3.10.2也可以
在这里插入图片描述
选择Download Windwos installer(64-bit)的那个,我的是64位的

如何查看自己的电脑是多少位的

方法1:

win11在桌面上找到此电脑,鼠标右键单机,再弹出的快捷菜单中选择属性
在这里插入图片描述
在这里插入图片描述
看到系统类型中的那个64位的没有

方法2:

windows+R,弹出对话框,输入按回车即可,
在这里插入图片描述
在这里插入图片描述

下载requests库

win+r,输入cmd,进入dos窗口,输入pip install requests,按下回车,然后你看到了一大堆白色文字的东西,安装成功,如果报错的话试试下面的这些命令

1.超时,你的窗口最下面应该有Timeout port等于啥的
解决办法:由于默认的下载源是在国外,所以比较慢,我们直接把下载源换成国内的就行

Pip install -I https://pypi.tuna.tsinghua.edu.cn/simple some-package
这是清华源
2.pip 版本不对,就是提示你应该把你的pip版本升级了
python -m pip install -U pip
若还有其他问题在评论区告诉我,尝试解决

一个小爬虫

import requests
src = "https://wwww.baidu.com"
resp = requests.get(src)
# 乱码的话 用下面这个
# resp.encoding = 'utf-8' 为什么是这个,页面源代码里面有,看下面的图片就行
print(resp.text)
resp.close()

乱码问题

在这里插入图片描述
在这里插入图片描述
把resp的encoding设置位charset的属性值即可,

然后你就看到了一大堆的东西,成功
小白一个,若有错误请大佬指出,看到了就会改

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值