Python学习,第一课(基础知识,利用urllib库入门)

这篇博客介绍了Python入门学习,重点讲解了如何利用urllib库进行网页抓取。作者从基础知识开始,包括环境配置、Python语法和库的使用,推荐了W3School作为学习资源。在实战部分,通过创建第一个爬虫程序,演示了如何抓取网页内容,使用bs4库解析HTML,并找到了数据的位置。虽然这次尝试没有直接获取到动态数据,但为后续学习打下了基础。
摘要由CSDN通过智能技术生成

基本知识

不知道多少人像我一样,技术底子还在,但是由于工作渐行渐远。Python大火的时候,也一股热情涌上心头,贼拉专业的部署了环境,然后不了了之。

在那之后很偶然的看到了Jack-Cui关于Python的内容,深入浅出,重燃了一下学习代码的热情。他的文章让人们看过后很快就能明白Python的运作机理(尤其爬虫部分)。

关于基础知识(到目前为止,关于环境、Python语法、库的相关知识都通过搜索即可)其实没必要去9.9的Python小课程,随便搜一下就能知道,这里还是推荐W3School

如果示例代码有无法运行的情况,一般情况是没有安装对应的包,所以,只需要万能的pip install就可以解决。

炫酷一些,自己安装它:
Windows + R
输入:cmd,潇洒回车
看看缺失的包,输入:

pip install 包名称

再来一次潇洒回车,结束战斗。

第一课,第一个小爬虫

首先,爬虫就是要爬取互联网上的内容。鉴于目前互联网传输数据的方式,还是要科普一些知识:

  1. URL:要爬取的地址,一定要完善,善用浏览器的Ctrl+Shift+I
  2. json:目前主流的数据格式,随便看一下明白它的结构;
  3. urllib库:Python爬虫必须要用到的库;

锁定目标

相信很多初学代码的同学,搞明白基础语法后,第一个学会的函数就是randmo。用它生成随机数可以做很多力所能及的小程序。
比如:猜数字、比大小、石头剪刀布
又或者,帮自己生成一注彩票号码,博个彩头。
所以,第一个爬虫,就试试彩票吧。

  1. 找网站,随便搜索一下双色球,能够找到中国福彩网的官方站点,就用它了,官方的就是最真实的。
  2. 找目标信息,随便点点,能够找到双色球的专属页面,记录一下地址。
  3. 创建第一个py程序,开始。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

红辣椒炒绿辣椒

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值