python爬虫-小白学习日志(分享超详细哦!更新中……)

大家好,这是一篇记录小白学习爬虫的日志,让我们共同进步吧!
摘要由CSDN通过智能技术生成

python爬虫–小白学习进程

大家好,这是一篇记录小白学习爬虫的日志,让我们共同进步吧!

2022.10.19 第一个小爬虫的实现

  1. 编程工具 :我使用的是pycharm2021版python3.7
    两天前遇到了些问题,就是我的pycharm过期了,用激活码重新搞了一下我的pycharm。搞了好半天,网上大部分都是过了期的。
  2. 学习课程:目前看的是B站的python大讲堂呀的课,目前感觉还可以,链接在这: 爬虫1000集
  3. 获取网站为百度
今日学习进程

1.所需代码:

下面展示 第一个小爬虫代码

from urllib.request import urlopen

url = "http://www.baidu.com"#注意:是http,不是https,两个抓取的代码关键字不同
resp = urlopen(url)

#print(resp.read().decode("utf-8")),需要+utf-8,这样可以将部分代码转换为
with open("mybaidu.html",mode="w",encoding="utf-8") as f:
    f.write(resp.read().decode("utf-8"))
print("over!")

2.学习过程和所遇问题及学习方法

(1)第一节:从urllib.request中导入urlopen,以便后续使用;将网站赋给url,使用urlopen打开url并赋给resp,最后输出读取内容

注意:敲代码的时候一定要细心,是http,不是https(不要直接复制网站),两个抓取的代码关键字有很大差别,具体什么不同,还有待学习,以下是问题展示
https代码如下:

from urllib.request import urlopen

url = "https://www.baidu.com"#注意:是http,不是https,两个抓取的代码关键字不同
resp 
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

匑倻

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值