自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

chasejava的博客

努力吧

  • 博客(5)
  • 资源 (9)
  • 收藏
  • 关注

原创 部署爬虫项目

第一步 安装scrapyd  在建立的虚拟环境中安装 pip install scrapyd退出虚拟环境中的是deactivate第二部:pip install scrapyd-client  这个不需要进入虚拟环境 第三部 cd 到当前项目目录下         将deploy:test           下面的url打开第四部:scrapyd-deploy              scra...

2018-04-21 18:12:50 350

原创 实现elasticsearch 和scrapy-redis分布式

kibana-5.1.2-windows-x86elasticsearch-rtfelasticsearch-headelasticsearch-rtf的版本最好要和kibana接近 具体操作可以从GitHub上查找使用到npm的话再去下载node.js在项目中建立一个models文件夹类似djangofrom datetime import datetimefrom elasticsearch...

2018-04-20 22:21:14 354

原创 使用fake-useragent 完成随机切换useragent

第一步 :pip install fake-useragent 第二步:在scrapy 中的mimiddlewares.py 中from fake_useragent import UserAgentua = UserAgent()class RandomChangeUserAgentMiddleware(object):    def __init__(self,crawler):   ...

2018-04-18 22:15:40 1562

原创 虚拟环境中安装scrapy

windows中安装scrapy1、pip install virtualenv   安装时可以使用豆瓣源镜像下载   例如:    pip install -i https://pypi.douban.com/simple/  django   但是有的可能没有对应的2、pip install virtualenvwrapper 3、workon  默认是c盘的    可以设置为其他的    在...

2018-04-14 17:12:40 685

原创 使用requests模拟登录知乎

# -*- coding:UTF-8 -*-参考 https://github.com/weldon2010/Python/blob/master/login_zhihu.py  import requests, timeimport hmac, json  需要的模块从js中可以看到from hashlib import sha1  这个也是"""打开 抓包工具 使用错误的密码登录查看实际的po...

2018-04-13 15:52:15 898

passer_keeper.tar.gz

celery和rabbitmq对接代码,其中rabbitmq已经在docker中部署好了,但是代码中是没有的。我只是方便自己查看,不是为了挣积分。

2020-09-14

ubuntu.pdf

包含nginxdockers的基本操作,供自己查看。有详细使用说明,从别的地方获取的简单使用。。。。。。。。。

2020-08-30

python hadoop spark2.0

这是python版本的重点在使用spark上handoop 分布式,也可以单独使用spark,挺新的

2019-03-02

python 高级教程,不适合初学者

这个不适合浏览,看着有点难度,好多平时没有用到的方法,挺实用

2019-03-02

百面机器学习

百面机器学习,我从别人那花积分买的,还得挣回来,简单干脆,三百多页,pdf 面试

2019-03-02

修改过后的代码,要不然使用scrapy中的crawler插入数据库总是报错

这个已经上传过一次,不建议下载,只是为了自己查看使用

2018-04-18

scrapy设置user-agent 和ip的和在线打码适合python3代码

里面是爬取的拉钩的测试代码,使用的是fake-useragent 设置动态代理 上传只是为了以后自己方便查看

2018-04-18

scrapy基础知识

上传是为了自己以后方便查看,你们最好也不要下载也没有写多少注释

2018-04-18

ssm增删改查代码

SSM CURD 分页使用的是pageHelper 全程使用Ajax交互 有兴趣的可以看看

2017-12-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除