Python
林成享
这个作者很懒,什么都没留下…
展开
-
Python数据爬取之0基础小白实战(三)源码解析
前两篇(一)软件安装、(二)初窥门槛我解决了软件版本不匹配的问题并学习关键技术、找到重要源码,完成了程序思路总体设计,本篇废话不多说,我们直接上源码。 任务描述 获取2015-2020年通过申请的国家科学自然基金中,E.工程与材料科学部下,E03.有机高分子材料及E05.机械设计与制造,这两子类的全部项目关键信息,并制为excel表。 经过广泛搜索,最终确定网站http://www.izaiwen.cn/为爬取对象,网站首页如下图所示。 源码 # -*- codeing = utf-8 -*- impor原创 2020-11-07 23:00:01 · 470 阅读 · 0 评论 -
Python数据爬取之0基础小白实战(二)初窥门槛
上一篇(一)软件安装我们说到,重装软件后解决了卡了两天的版本不匹配问题。 本篇“初窥门槛”记录我完成版本匹配后,学会获取url,学习谷歌Web Scraper插件并被劝退,成功识别网站“乱码”,逐渐跑通Python代码,完成程序架构设计的全过程。 任务描述 获取2015-2020年通过申请的国家科学自然基金中,E.工程与材料科学部下,E03.有机高分子材料及E05.机械设计与制造,这两子类的全部项目关键信息,并制为excel表。 经过广泛搜索,最终确定网站http://www.izaiwen.cn/为爬取对原创 2020-11-07 20:14:42 · 378 阅读 · 0 评论 -
Python数据爬取之0基础小白实战(一)软件安装
引言 首先声明,笔者所说的0基础并非编程0基础,而是系统学习过c++程序设计,编程水平中等偏上。只是对Python的语法、HTML的架构、网络通信的HTTP协议一无所知。 学习Python的背景是小老板让我查找近五年相关领域申请通过的全部自然基金,并做成excel表给他。大概查了一下,上千条信息,海量的工作量,于是萌生了用Python爬一下的构想,顺便解锁新技能。 从萌生想法到爬取成功历时4天,为了方便大家阅读,我把内容分为三章,分别是软件安装,初窥门槛,源码解析。 (一)软件安装:包含了Python和Py原创 2020-11-07 17:53:50 · 441 阅读 · 0 评论