本文使用自己创建的网页进行模拟和演示,在爬取真实网页时,分析网页源代码然后修改代码中的正则表达式即可。
假设某网页源代码为:
在Hbuilder中单击菜单“运行”,选择使用Google Chrome浏览器打开,如图所示:
编写下面的Python程序:
爬虫程序生成的本地Excel文件内容如下:
--------图书大优惠--------
1)《Python程序设计(第2版)》(2018年8月第9次印刷)
清华大学出版社官方链接:https://detail.tmall.com/item.htm?spm=a1z10.3-b-s.w4011-18452336119.33.24a52226InbLT2&id=534581929248&rn=2925c5faf17252719ab36155de9bef46&abbucket=6
2)《Python可以这样学》(2018年7月第6次印刷)(本书已发行繁体版)
原价69元,特价48.3元,每人限购5本,清华大学出版社官方链接:https://detail.tmall.com/item.htm?spm=a1z10.3-b-s.w4011-18452336119.27.24a52226InbLT2&id=544817105410&rn=2925c5faf17252719ab36155de9bef46&abbucket=6
3)《Python程序设计基础(第2版)》(2018年8月第4次印刷)
清华大学出版社官方链接:https://detail.tmall.com/item.htm?spm=a1z10.3-b-s.w4011-18452336119.35.24a52226InbLT2&id=565581275846&rn=2925c5faf17252719ab36155de9bef46&abbucket=6
4)《中学生可以这样学Python》2018年5月第2次印刷)
清华大学出版社官方链接:https://detail.tmall.com/item.htm?spm=a1z10.3-b-s.w4011-18452336119.37.24a52226InbLT2&id=560808221053&rn=2925c5faf17252719ab36155de9bef46&abbucket=6
5)《Python程序设计开发宝典》(2018年2月第3次印刷)
原价69元,特价48.3元,每人限购5本,清华大学出版社官方链接:https://detail.tmall.com/item.htm?spm=a1z10.3-b-s.w4011-18452336119.71.24a52226InbLT2&id=556093887133&rn=2925c5faf17252719ab36155de9bef46&abbucket=6
6)《玩转Python轻松过二级》(2018年7月第3次印刷)
原价49元,特价34.3元,每人限购5本,清华大学出版社官方链接:https://detail.tmall.com/item.htm?spm=a1z10.3-b-s.w4011-18452336119.31.24a52226InbLT2&id=569250004069&rn=2925c5faf17252719ab36155de9bef46&abbucket=6
7)《Python程序设计基础与应用》(2018年9月上架)
董付国老师6本Python系列教材被北大、复旦等近百所高校选作教材
董老师127课免费视频地址: https://pan.baidu.com/s/1jJeAs8Q 密码: px59
----------相关阅读----------
教学课件
1900页Python系列PPT分享一:基础知识(106页)
1900页Python系列PPT分享二:Python序列(列表、元组、字典、集合)(154页)
1900页Python系列PPT分享三:选择与循环结构语法及案例(96页)
1900页Python系列PPT分享四:字符串与正则表达式(109页)
1900页Python系列PPT分享五:函数设计与应用(134页)
1900页Python系列PPT分享六:面向对象程序设计(86页)
1900页Python系列PPT分享七:文件操作(132页)
1900页Python系列PPT分享八:异常处理结构与程序调试、测试(70页)
报告PPT(163页):基于Python语言的课程群建设探讨与实践
系列题库分享
相关阅读
Python爬虫基础:常用HTML标签和Javascript入门
Python+selenium+PhantomJS获取百度搜索结果真实链接地址
手把手教你使用Python+scrapy爬取山东各城市天气预报
Python爬虫系列:使用selenium+Edge查询指定城市天气情况
BeautifulSoup解析库select方法实例——获取企业信息