自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

smalljun的博客

走在python攻城狮路上的攻城狮

  • 博客(16)
  • 收藏
  • 关注

原创 pycharm---更改背景颜色

1.找到file-->Settings2.更改为你想要的颜色

2018-07-11 19:16:39 41678 1

原创 邮箱的发送--plus

1.qq邮箱信息的发布# 用于发送邮件的模块import smtplib# QQ邮箱/163邮箱的邮件发送:py文件发送邮件内容相当于一个第三方的客户端,借助于QQ/163邮箱服务器来发送的邮件。# QQ邮件# 1> 配置邮箱SMTP服务器的主机地址,将来使用这个服务器收发邮件。HOST = 'smtp.qq.com'# 2> 配置服务的端口,默...

2018-07-11 17:56:41 1292

原创 如何切换Python版本--基于window10系统

1.如果你的电脑上装的是Python3.6.0和Python3.7.0,并且你先装的Python3.6.0,后装的Python3.7.0;那么它将默认的是Python3.7.0在cmd中输入命令: where python       可以查看python安装的位置以及版本号                             python                   查看默认使用的p...

2018-07-09 21:40:03 27466 3

原创 scrapy---将数据json化保存---mongo数据库---mysql数据库---excel里--下载图片(分类)----下载文件

                                     json方法一:通过在cmd中输命令来实现scrapy crawl novel -o novel.json -s FEED_EXPORT_ENCIDING=UTF-8novel为爬虫名称(name)scrapy将数据保存为csv文件: scrapy crawl novel -o novel.csv -s FEED_EXPOR...

2018-07-07 11:37:59 325

原创 爬虫实战项目--优信二手车--天眼

import requests, time, randomfrom fake_useragent import UserAgentfrom lxml.html import etree, HTMLParserfrom requests.packages.urllib3.exceptions import InsecureRequestWarning, InsecurePlatformWar...

2018-07-03 10:50:21 9770

原创 免登录 cookie 和 session

        课前准备下载 :    charles(抓包工具)1.  cookie  和  session  的用法和原理

2018-07-03 10:49:38 454

原创 安装--redis 数据库--配置代理池

1.  # 代理ip# 默认爬虫是使用的是真实IP,为了伪装真实IP,使用代理IP(代理IP会一直在变)# redis 数据库是内存型数据库,既支持将数据存储到内存,也可以将数据进行持久化的本地存储# redis 非常适合做数据的缓存2.  34....

2018-07-03 10:49:17 882 1

原创 安装--proxypool--配置

搜索:  github 搜索  proxy_pool下载    2解压到指定的位置3如果没有安装,在cmd命令框里进行安装,,pip install  APScheduler==3.2.0werkzeug==0.11.15等等4.

2018-07-03 10:48:45 2113

原创 安装--pyspider

1.  官网下载2.找到下载并解压之后的文件  进行复制phantomjs.exe3.  查看python路径, 将phantomjs.exe和python.exe放在同一目录下4.

2018-07-03 10:48:29 1743

原创 爬虫知识点---微信搜狗---xpath--pyquery--csselect--正则--bs4

1.  微信搜狗      大神的代码  import requests, re, pymongo, timefrom fake_useragent import UserAgentfrom urllib.parse import urlencodefrom pyquery import PyQueryfrom requests.exceptions import C...

2018-07-03 10:48:05 1694

原创 安装--mongo数据库

安装xlwt的方法(爬虫) 或者是在cmd里面直接敲命令:pip install xlwt 安装即可 MOngo数据库安装(爬虫)Custom 是选择安装的路径 需要在创建的data\db中敲命令:  mongod --dbpath “\data\db的路径”  保持命令行的黑窗口处于打开的状态,然后在浏览器上进行访问在浏览器中进行访问:127.0.0.1:27017 安装服务为自动启动的状态命令...

2018-07-03 10:47:45 186

原创 爬虫--爬取网页图片--bs4

1.  爬虫网络请求方式:  urllib(模块),requests(库),  scrapy , pyspider  (框架)2. 爬虫数据提取方式:  正则表达是,  bs4, lxml, xpath,  css# 参数1:序列化的html源代码字符串,将其序列化成一个文档树对象。# 参数2:将采用 lxml 这个解析库来序列化 html 源代码html = BeautifulSoup(op...

2018-07-03 10:46:30 2197

原创 selenium--安装--知识点--base--元素等待

安装1. 火狐浏览器: 下载geckodriver.exe把这个文件放在和python.exe相同的路径下geckodriver.exe: 是selenium用来打开火狐浏览器的驱动。需要将它和python.exe放在一起2. 下载的位置:https://github.com/mozilla/geckodriver/releases最新版火狐浏览器驱动geckodriver的地址。知识点:s...

2018-07-03 10:46:09 389

原创 scrapy---安装配置虚拟环境--爬虫--知识点--配置cookiespool

Python虚拟环境的安装和配置(windows)1.先在电脑上将python2.7和python3.5版本安装完成,并记清楚安装路径,统一安装在D盘2.配置系统环境变量中的path路径,添加路径的版本即为默认使用版本 3.在命令行工具中输入pip install virtualenv 下载python虚拟环境 4.在使用pip下载包时,经常会出现超时等情况,可以使用国内镜像提高下载速度,例如豆瓣...

2018-07-03 10:45:49 702 1

原创 Pycharm

pycharm查找内容并替换内容

2018-07-03 10:44:37 195

原创 安装--charles--抓包工具

1.  搜索安装  charles  安装  创建快捷键到桌面2. 3.4.5.6.7.8.安装证书完毕   !!!!!!!!!

2018-06-09 17:33:08 315

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除