Python爬虫实战一：爬取csdn学院所有课程名、价格和课时

yihan.z

于 2018-06-23 01:14:21 发布

阅读量2k

点赞数

分类专栏：爬

本文链接：https://blog.csdn.net/qq_33361618/article/details/80766395

版权

本文详细介绍了如何使用Python进行网络爬虫实战，通过爬取csdn学院的所有课程名称、价格和课时数，展示了爬虫的基本流程和技术要点。

摘要由CSDN通过智能技术生成

作为第一个学习的爬虫小程序，选取csdn学院，主要是该网站无反爬或较简单，不需要模拟浏览器和代理IP，也不需要验证和登录信息，对于新手而言，是非常亲民的；其次，需要爬取的内容都能在网页源码中显示。本篇文章使用urllib和正则表达式进行爬取。

步骤一：

分析网站，建议使用能查看网页源码的浏览器分析网站，找到所有课程，价格和课时；

课程名所在位置：

<img src="https://img-bss.csdn.net/201708171721537407.gif" width="179" height="120" alt="让机器“看见”—计算机视觉原理及实战">

价格所在位置：

 <p class="clearfix">
                        <i>
                            ￥269.10                        </i>

课时所在位置：

<p><em>82</

关注

专栏目录