自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 踩坑日记-记录那些年踩过的坑

大数据开发篇: 一,组件搭建中 scala在IDEA里面不能添加插件的问题 解决方式:解决方式: 删除C盘里面的IDEA的目录,重启IDEA,在IDEA里面选择scala插件下载 搭建zk环境时报错:拒绝连接 解决方式:1、检查其他机器,发现JDK版本不一样,版本统一后问题解决 二,开发中 python开发篇: 一, web开发中 二,爬虫开发中 中文数据存储mysql中报错 这里存储...

2020-04-18 10:50:43 265

原创 爬虫-基于request模块bs4解析爬取天气网实现可视化

python

2020-04-18 11:24:43 219

原创 爬虫-基于selenium模块正则解析实现对斗鱼直播数据抓取并持久化存储

本次通过selenium插件来实现爬虫,selenium个人感觉还是很不错的,官方文档,其实看文档还是很有用的,这个习惯可以有 首先老规矩分析目标网站 目标网站:斗鱼直播 https://www.douyu.com/directory/all 目标数据:直播间名称,直播间类型,主播名称,房间人数(这个不清楚到底是个啥,反正数值很大) 1,首先做个架子 2,分析目标网站 打开开发者模式之后,点击...

2020-04-15 00:34:04 650

原创 爬虫-基于urllib模块通过正则解析爬取猫眼电影

首先确定目标 目标网站:猫眼电影 目标数据:电影名称,演员,上映日期 首先分析网页结构,打开猫眼电影 以猫眼top100的第二页为目标,爬取想要的数据,查看网页结构 找到目标字段对应的标签 电影名的标签 = title 演员的标签 = star 上映时间的标签 = releasetime 准备代码 前面都是固定的格式,要准备目标url地址 和headers信息 将整页数据爬取下来后,通过正则...

2020-04-02 22:45:23 616

原创 爬虫-基于requests模块xpath解析爬取豆瓣即将上映电影目录

首先,我们要确定要爬取的对象,然后确定我们需要的数据,要有针对性的去分析,打开豆瓣网查看 在这里我们可以看到即将上映的电影不多呀,先试试这个吧… 右键检查,打开开发者模式 此时点击NETWORK选项是没有数据的,我们需要F5刷新一下就可以看到数据了 我们找到深圳,然后可以看到我们请求的URL地址是吧,继续往下看,找到我们的request headers信息 referer、cookies...

2020-04-02 11:13:07 595

原创 Django框架

django框架配置 安装django pip install django==1.8.2

2020-03-29 12:59:35 75

原创 虚拟空间的安装配置

虚拟空间的安装配置 以我自己为例,我使用的是uabntu18.04版本 为了使项目之间的软件版本不冲突,我们才创建虚拟空间 首先 sudo pip install virtualenv 然后安装虚拟环境拓展包 sudo pip install virtualenvwrapper 在修改用户目录下的 .bashrc文件 在文件中添加一下内容 export WORKON_HOME=$HOME/.bas...

2020-03-29 12:52:23 415

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除