自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 python爬取疫情数据保存至mysql

python爬取疫情数据保存至mysql目标数据由于数据是Json格式,这里使用了正则表达式解析数据。本次爬取难度不大,主要有以下两点需要注意正则表达式的规则;用(.*?)表示待匹配的内容,将左、右两边的数据卡死(常规套路)。爬下来的数据,需要转为List类型才能放到mysql中。保存到mysql中:完整代码:# 2020/9/10import requests,reimport pymysqlclass Crawl(object): def __init

2020-09-13 10:30:46 547

原创 使用python爬取前程无忧上的岗位信息

前程无忧目前属于静态网站,,爬取起来难度不大步骤分析:1.进入目标网站,观察和判断网站的类型这里用谷歌浏览器 鼠标右键打开开发者模式,勾选network,xhr选项并刷新页面如下图所示,xhr作为ajax的对象载体,这里并发现内容并没有变化,凭此可以判断这是一个静态页面2.确定岗位和区域范围,这里以JAVA和成渝地区为例3.确定之后,观察url的变化规律,发现:以数字2为界,左边...

2019-11-10 19:43:12 843

原创 python爬取一部小说

这次爬取一个鬼吹灯的小说步骤很简单第一步:选取目标小说的网站(这次是个静态网站)第二步:获取网页源码(由于静态网站的缘故,这一步非常简单了)第三步:使用正则表达式,或任意解析库,解析源码信息第四步:保存到本地,小说就保存为txt格式,手机也可以看这次操作占用的资源很少,所以也不需要引用scrapy框架,或selenium插件。下面直接套代码:import requests,json...

2019-11-10 19:10:08 332

转载 Linux上安装Pycharm

Linux上安装Pycharm(是自己Linux上安装的第一个软件)这里记录下具体流程:1.下载资源:去官网下载就行。2. 软件安装(这里一定要清楚软件安装的路径,通常会在home目录的Downloads下):解压命令:tar -zxvf pycharm路径 ,3. 解压完成后,需要修改配置文件切换为root用户后, 输入 vim/etc/hosts添加这行代码 0.0.0.0 ...

2019-09-22 12:43:40 255

原创 Ubuntu上安装vim编辑器

当虚拟机上安装linux/Ubuntu时,默认是不会自带vim编辑器的,而如果使用vi,在操作上感觉并不是很方便(具体就是backspace)。所以这里要安装vim包,打开终端输入:sudo apt-get install vim 接下来,发现linux命令确实好用。不用一会,就安装完成了。...

2019-09-18 21:51:15 859

原创 使用scrapy爬取一部小说

使用scrapy爬取一部小说 一.安装scrapy框架:(在安装有python,以及几个必须的依赖库的情况下)打开cmd终端,输入 pip install scrapy,安装成功后,可以看到Successfully installl Scrapy-x.x.x这里的pip 指的python的包管理工具二.创建项目,爬虫文件:切换到任意盘符的根目录,输入 scrapy startproje...

2019-09-18 21:16:30 809

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除