自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 ubuntu 18.04 Nginx源码安装

Nginx源码安装一, 首先需安装nginx依赖库1.安装gcc g++的依赖库apt-get install build-essentialapt-get install libtool2.安装pcre依赖库sudo apt-get updatesudo apt-get install libpcre3 libpcre3-dev3.安装zlib依赖库apt-get inst...

2019-01-22 17:04:17 3356 1

原创 使用Selenium添加访问cookie, 实现淘宝自动登录

淘宝在不登录的情况下, 许多信息没有显示, 而在登录滑块验证时, selenium模拟会被检测出来, 所以我们利用手机扫码登录, 保存cookies并实现之后登录访问.登录并保存cookieimport jsonfrom selenium import webdriverfrom selenium.webdriver.firefox.options import Optionsopti...

2019-01-17 16:37:12 6821 8

原创 python 更换pip安装源

pip源, 默认从国外源安装, 安装速度比较慢. 现在我们指定国内源安装源: 阿里源、豆瓣源.Ubuntu源,(1)指令配置源 pip3 install xlrd -i https://pypi.tuna.tsinghua.edu.cn/simple/(2)永久配置 pip install bs4windows 1、打开文件资源管理器 2、地址栏输入 %a...

2019-01-07 10:22:27 625

原创 一个实现scrapy框架部分功能的爬虫(实现了,下载限流器,随机ip代理, 下载去重等功能)

这是一个具备可扩展功能的爬虫!!!import osimport requestsfrom fake_useragent import UserAgentfrom retrying import retryimport hashlib # 信息摘要 md5import queue # 队列import re # 正则表达式from urllib import robotpa...

2019-01-06 16:54:18 348

原创 [爬虫]爬取猫眼电影票房信息(信息字体加密)

猫眼电影里面的实时票房, 票房占比等信息是字体加密的, 所以要爬取这些信息需要解决字体加密这个问题. 下面介绍一种解密字体的办法.在橙色方块标注的地方我们可以看出字体是加密的, 我们就以这部分字体为例进行解析.首先我面要找到加密的字体, 查看网页源代码, 搜索font-family, 找到base64后面的字体字符串, 下图中方框中的部分.创建一个font_cat.py的文件, 并将这部分...

2019-01-06 16:38:31 2682

转载 Numpy包函数的使用(史上最全)

1.NumPy  NumPy是高性能科学计算和数据分析的基础包。部分功能如下:ndarray, 具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组。用于对整组数据进行快速运算的标准数学函数(无需编写循环)。用于读写磁盘数据的工具以及用于操作内存映射文件的工具。线性代数、随机数生成以及傅里叶变换功能。用于集成C、C++、Fortran等语言编写的代码的工具。  首先...

2019-01-05 13:14:40 754 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除