vscode用python爬取网站源代码,返回的获取状态是成功的,但是输出的源代码少了开头到中间那一半。

更新一下。

giao,找到解决方案了,这是一个输出信息太长,终端输出不全的问题。已经有很多大佬提出解决方案了。

这好像是vscode的这个编辑器的问题,我换用了vs2019就获得了完整源码。我到现在都没搞明白,vscode哪里出了问题。

我从别人的文章找到了解决方法:就是不用print函数输出,而是将源代码写进一个文件,从文件中查看网页源代码。这个方法可以获得完整的网页源代码,但我感觉有点不方便,这么看源代码有点别扭。诶,vscode这方面到底是先天不足,还是我环境搭建有问题。

少了开头到将近中间的那一半

import requests

import re

url = "https://www.sina.com.cn/"

response = requests.get(url)

print(response.status_code)

response.encoding = "utf-8"

page_txet = response.text

with open("b.txt","w+",encoding="utf-8") as f:

    f.write(page_txet)

用with f 将源代码写进b.txt中

就能得到完整的源代码了

这个方法只是个补丁,不知道有没有大佬能真正解决这个问题。

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值