自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 Python数据爬取之0基础小白实战(三)源码解析

前两篇(一)软件安装、(二)初窥门槛我解决了软件版本不匹配的问题并学习关键技术、找到重要源码,完成了程序思路总体设计,本篇废话不多说,我们直接上源码。 任务描述 获取2015-2020年通过申请的国家科学自然基金中,E.工程与材料科学部下,E03.有机高分子材料及E05.机械设计与制造,这两子类的全部项目关键信息,并制为excel表。 经过广泛搜索,最终确定网站http://www.izaiwen.cn/为爬取对象,网站首页如下图所示。 源码 # -*- codeing = utf-8 -*- impor

2020-11-07 23:00:01 467

原创 Python数据爬取之0基础小白实战(二)初窥门槛

上一篇(一)软件安装我们说到,重装软件后解决了卡了两天的版本不匹配问题。 本篇“初窥门槛”记录我完成版本匹配后,学会获取url,学习谷歌Web Scraper插件并被劝退,成功识别网站“乱码”,逐渐跑通Python代码,完成程序架构设计的全过程。 任务描述 获取2015-2020年通过申请的国家科学自然基金中,E.工程与材料科学部下,E03.有机高分子材料及E05.机械设计与制造,这两子类的全部项目关键信息,并制为excel表。 经过广泛搜索,最终确定网站http://www.izaiwen.cn/为爬取对

2020-11-07 20:14:42 372

原创 Python数据爬取之0基础小白实战(一)软件安装

引言 首先声明,笔者所说的0基础并非编程0基础,而是系统学习过c++程序设计,编程水平中等偏上。只是对Python的语法、HTML的架构、网络通信的HTTP协议一无所知。 学习Python的背景是小老板让我查找近五年相关领域申请通过的全部自然基金,并做成excel表给他。大概查了一下,上千条信息,海量的工作量,于是萌生了用Python爬一下的构想,顺便解锁新技能。 从萌生想法到爬取成功历时4天,为了方便大家阅读,我把内容分为三章,分别是软件安装,初窥门槛,源码解析。 (一)软件安装:包含了Python和Py

2020-11-07 17:53:50 438

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除