林成享-CSDN博客

原创 Python数据爬取之0基础小白实战（三）源码解析

前两篇（一）软件安装、（二）初窥门槛我解决了软件版本不匹配的问题并学习关键技术、找到重要源码，完成了程序思路总体设计，本篇废话不多说，我们直接上源码。任务描述获取2015-2020年通过申请的国家科学自然基金中，E.工程与材料科学部下，E03.有机高分子材料及E05.机械设计与制造，这两子类的全部项目关键信息，并制为excel表。经过广泛搜索，最终确定网站http://www.izaiwen.cn/为爬取对象，网站首页如下图所示。源码# -*- codeing = utf-8 -*-impor

2020-11-07 23:00:01 480

原创 Python数据爬取之0基础小白实战（二）初窥门槛

上一篇（一）软件安装我们说到，重装软件后解决了卡了两天的版本不匹配问题。本篇“初窥门槛”记录我完成版本匹配后，学会获取url，学习谷歌Web Scraper插件并被劝退，成功识别网站“乱码”，逐渐跑通Python代码，完成程序架构设计的全过程。任务描述获取2015-2020年通过申请的国家科学自然基金中，E.工程与材料科学部下，E03.有机高分子材料及E05.机械设计与制造，这两子类的全部项目关键信息，并制为excel表。经过广泛搜索，最终确定网站http://www.izaiwen.cn/为爬取对

2020-11-07 20:14:42 385

原创 Python数据爬取之0基础小白实战（一）软件安装

引言首先声明，笔者所说的0基础并非编程0基础，而是系统学习过c++程序设计，编程水平中等偏上。只是对Python的语法、HTML的架构、网络通信的HTTP协议一无所知。学习Python的背景是小老板让我查找近五年相关领域申请通过的全部自然基金，并做成excel表给他。大概查了一下，上千条信息，海量的工作量，于是萌生了用Python爬一下的构想，顺便解锁新技能。从萌生想法到爬取成功历时4天，为了方便大家阅读，我把内容分为三章，分别是软件安装，初窥门槛，源码解析。（一）软件安装：包含了Python和Py

2020-11-07 17:53:50 450

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人