自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 通过scrapy,从模拟登录开始爬取知乎的问答数据

通过scrapy,从模拟登录开始爬取知乎的问答数据这篇文章将讲解如何爬取知乎上面的问答数据。首先,我们需要知道,想要爬取知乎上面的数据,第一步肯定是登录,所以我们先介绍一下模拟登录:先说一下我的思路:1.首先我们需要控制登录的入口,重写start_requests方法。来控制到这个入口之后,使用callback回调函数来调用login函数.2.在login函数中通过response.text获取到该

2017-12-23 17:42:01 3089

原创 利用AJAX JAVA 通过Echarts实现豆瓣电影TOP250的数据可视化

1.mysql表的结构2.数据(数据是通过爬虫得来的,本篇文章不介绍怎么爬取数据,只介绍将数据库中的数据可视化):下面就是写代码了:首先看一下项目目录:数据库层:业务逻辑层:package dao;import java.sql.ResultSet;import java.sql.SQLExceptio

2017-12-03 19:15:46 1941

原创 Scrapy爬取伯乐在线的所有文章

前置工作:1. 配置环境变量2.创建虚拟环境3. 安装scrapy (在这里不作介绍,注意有几个前置包安装成功才能装scrapy)4.创建scrapy项目5.更换虚拟环境6. 新创建一个spider名为jobbole7.创建一个用于测试的py文件。名字为main8. 下面运行一下main9.项目可以正常跑起来的情况下,下面就是开始写代码,

2017-12-03 10:34:03 1662

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除