封面图片:《Python程序设计实验指导书》(ISBN:9787302525790),董付国,清华大学出版社
图书详情:https://item.jd.com/12592638.html
================
问题描述:爬取微信公众号“Python小屋”所有文章,每篇文章生成一个独立的Word文档,包含该文中的文字、图片、表格、超链接。
技术要点:扩展库requests、beautifulsoup4、python-docx。
================
第一步,安装代码中需要用到的扩展库requests、beautifulsoup4、python-docx。遇到问题可以参考Python编程常见出错信息及原因分析(5):安装扩展库
第二步,微信关注公众号“Python小屋”,进入菜单“最新资源”==>“历史文章”,复制该文链接,然后使用电脑端浏览器打开该链接,查看公众号所有文章的清单,如图:
第三步,查看网页源代码,分析每篇文章链接的结构,如图:
第四步,查看几篇文章,分别分析网页源代码中文字、图、表格、超链接的结构特点,如图:
第五步,编写代码。
第六步,运行爬虫程序,生成Word文档。
温馨提示
关注本公众号“Python小屋”,通过菜单“最新资源”==>“历史文章”可以快速查看分专题的800篇技术文章列表(可根据关键字在页面上搜索感兴趣的文章),通过“最新资源”==>“微课专区”可以免费观看300节Python微课,通过“最新资源”==>“培训动态”可以查看近期Python培训安排,通过“最新资源”==>“教学资源”可以查看Python教学资源。
--------董付国老师Python系列图书--------
友情提示:不建议购买太多,最好先通过京东、当当、天猫查阅图书了解目录和侧重点,然后再选择购买适合自己的书。
1)《Python程序设计(第2版)》清华大学出版社,2016年8月
2)《Python可以这样学》清华大学出版社,2017年2月
3)《Python程序设计基础(第2版)》清华大学出版社,2018年1月
4)《中学生可以这样学Python》清华大学出版社,配套微课:《中学生可以这样学Python》84节微课免费观看地址
5)《Python程序设计开发宝典》清华大学出版社,2018年10月
6)《玩转Python轻松过二级》清华大学出版社,2018年5月
7)《Python程序设计基础与应用》机械工业出版社,2018年9月
8)《Python程序设计实验指导书》清华大学出版社,2019年4月
9)《Python编程基础与案例集锦(中学版)》电子工业出版社,2019年4月
10)《大数据的Python基础》机械工业出版社,预计2019年5月出版
11)译作《Python程序设计》,机械工业出版社(华章),2018年11月出版
12)繁体版《Python也可以这样学》,台湾博硕文化股份有限公司,2017年10月出版,本书为《Python可以这样学》在台湾发行的繁体版,两本书内容一样,不建议重复购买。
“Python小屋”免费资源汇总(截至2018年11月28日)
课后习题答案
实验指导书
Python实验项目1例:使用进程池统计指定范围内素数的个数
教学大纲
课件
1900页Python系列PPT分享一:基础知识(106页)
1900页Python系列PPT分享二:Python序列(列表、元组、字典、集合)(154页)
1900页Python系列PPT分享三:选择与循环结构语法及案例(96页)
1900页Python系列PPT分享四:字符串与正则表达式(109页)
1900页Python系列PPT分享五:函数设计与应用(134页)
1900页Python系列PPT分享六:面向对象程序设计(86页)
1900页Python系列PPT分享七:文件操作(132页)
1900页Python系列PPT分享八:异常处理结构与程序调试、测试(70页)
2000页Python系列PPT分享九:(GUI编程)(122页)
报告PPT