Python爬虫实战一:爬取csdn学院所有课程名、价格和课时

本文详细介绍了如何使用Python进行网络爬虫实战,通过爬取csdn学院的所有课程名称、价格和课时数,展示了爬虫的基本流程和技术要点。
摘要由CSDN通过智能技术生成
      作为第一个学习的爬虫小程序,选取csdn学院,主要是该网站无反爬或较简单,不需要模拟浏览器和代理IP,也不需要验证和登录信息,对于新手而言,是非常亲民的;其次,需要爬取的内容都能在网页源码中显示。本篇文章使用urllib和正则表达式进行爬取。
步骤一:
     分析网站,建议使用能查看网页源码的浏览器分析网站,找到所有课程,价格和课时;
     课程名所在位置:
<img src="https://img-bss.csdn.net/201708171721537407.gif" width="179" height="120" alt="让机器“看见”—计算机视觉原理及实战">
    价格所在位置:
 <p class="clearfix">
                        <i>
                            ¥269.10                        </i>

    课时所在位置:
<p><em>82</
  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值