smalljun520
码龄7年
关注
提问 私信
  • 博客:91,093
    91,093
    总访问量
  • 16
    原创
  • 893,065
    排名
  • 18
    粉丝
  • 0
    铁粉

个人简介:python高级开发工程师

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:河南省
  • 加入CSDN时间: 2018-05-25
博客简介:

smalljun的博客

博客描述:
走在python攻城狮路上的攻城狮
查看详细资料
个人成就
  • 获得66次点赞
  • 内容获得13次评论
  • 获得82次收藏
创作历程
  • 16篇
    2018年
成就勋章
TA的专栏
  • python学习记录
  • 安装
    8篇
  • 爬虫知识点
    6篇
  • pycharm功能组合
    2篇
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

pycharm---更改背景颜色

1.找到file-->Settings2.更改为你想要的颜色
原创
发布博客 2018.07.11 ·
41598 阅读 ·
45 点赞 ·
1 评论 ·
13 收藏

邮箱的发送--plus

1.qq邮箱信息的发布# 用于发送邮件的模块import smtplib# QQ邮箱/163邮箱的邮件发送:py文件发送邮件内容相当于一个第三方的客户端,借助于QQ/163邮箱服务器来发送的邮件。# QQ邮件# 1> 配置邮箱SMTP服务器的主机地址,将来使用这个服务器收发邮件。HOST = 'smtp.qq.com'# 2> 配置服务的端口,默...
原创
发布博客 2018.07.11 ·
1278 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

如何切换Python版本--基于window10系统

1.如果你的电脑上装的是Python3.6.0和Python3.7.0,并且你先装的Python3.6.0,后装的Python3.7.0;那么它将默认的是Python3.7.0在cmd中输入命令: where python       可以查看python安装的位置以及版本号                             python                   查看默认使用的p...
原创
发布博客 2018.07.09 ·
27397 阅读 ·
18 点赞 ·
3 评论 ·
60 收藏

scrapy---将数据json化保存---mongo数据库---mysql数据库---excel里--下载图片(分类)----下载文件

                                     json方法一:通过在cmd中输命令来实现scrapy crawl novel -o novel.json -s FEED_EXPORT_ENCIDING=UTF-8novel为爬虫名称(name)scrapy将数据保存为csv文件: scrapy crawl novel -o novel.csv -s FEED_EXPOR...
原创
发布博客 2018.07.07 ·
313 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

爬虫实战项目--优信二手车--天眼

import requests, time, randomfrom fake_useragent import UserAgentfrom lxml.html import etree, HTMLParserfrom requests.packages.urllib3.exceptions import InsecureRequestWarning, InsecurePlatformWar...
原创
发布博客 2018.07.03 ·
9735 阅读 ·
0 点赞 ·
0 评论 ·
4 收藏

免登录 cookie 和 session

        课前准备下载 :    charles(抓包工具)1.  cookie  和  session  的用法和原理
原创
发布博客 2018.07.03 ·
438 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

安装--redis 数据库--配置代理池

1.  # 代理ip# 默认爬虫是使用的是真实IP,为了伪装真实IP,使用代理IP(代理IP会一直在变)# redis 数据库是内存型数据库,既支持将数据存储到内存,也可以将数据进行持久化的本地存储# redis 非常适合做数据的缓存2.  34....
原创
发布博客 2018.07.03 ·
860 阅读 ·
0 点赞 ·
1 评论 ·
1 收藏

安装--proxypool--配置

搜索:  github 搜索  proxy_pool下载    2解压到指定的位置3如果没有安装,在cmd命令框里进行安装,,pip install  APScheduler==3.2.0werkzeug==0.11.15等等4.
原创
发布博客 2018.07.03 ·
2091 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

安装--pyspider

1.  官网下载2.找到下载并解压之后的文件  进行复制phantomjs.exe3.  查看python路径, 将phantomjs.exe和python.exe放在同一目录下4.
原创
发布博客 2018.07.03 ·
1725 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

爬虫知识点---微信搜狗---xpath--pyquery--csselect--正则--bs4

1.  微信搜狗      大神的代码  import requests, re, pymongo, timefrom fake_useragent import UserAgentfrom urllib.parse import urlencodefrom pyquery import PyQueryfrom requests.exceptions import C...
原创
发布博客 2018.07.03 ·
1678 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

安装--mongo数据库

安装xlwt的方法(爬虫) 或者是在cmd里面直接敲命令:pip install xlwt 安装即可 MOngo数据库安装(爬虫)Custom 是选择安装的路径 需要在创建的data\db中敲命令:  mongod --dbpath “\data\db的路径”  保持命令行的黑窗口处于打开的状态,然后在浏览器上进行访问在浏览器中进行访问:127.0.0.1:27017 安装服务为自动启动的状态命令...
原创
发布博客 2018.07.03 ·
176 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

爬虫--爬取网页图片--bs4

1.  爬虫网络请求方式:  urllib(模块),requests(库),  scrapy , pyspider  (框架)2. 爬虫数据提取方式:  正则表达是,  bs4, lxml, xpath,  css# 参数1:序列化的html源代码字符串,将其序列化成一个文档树对象。# 参数2:将采用 lxml 这个解析库来序列化 html 源代码html = BeautifulSoup(op...
原创
发布博客 2018.07.03 ·
2181 阅读 ·
0 点赞 ·
0 评论 ·
6 收藏

selenium--安装--知识点--base--元素等待

安装1. 火狐浏览器: 下载geckodriver.exe把这个文件放在和python.exe相同的路径下geckodriver.exe: 是selenium用来打开火狐浏览器的驱动。需要将它和python.exe放在一起2. 下载的位置:https://github.com/mozilla/geckodriver/releases最新版火狐浏览器驱动geckodriver的地址。知识点:s...
原创
发布博客 2018.07.03 ·
366 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

scrapy---安装配置虚拟环境--爬虫--知识点--配置cookiespool

Python虚拟环境的安装和配置(windows)1.先在电脑上将python2.7和python3.5版本安装完成,并记清楚安装路径,统一安装在D盘2.配置系统环境变量中的path路径,添加路径的版本即为默认使用版本 3.在命令行工具中输入pip install virtualenv 下载python虚拟环境 4.在使用pip下载包时,经常会出现超时等情况,可以使用国内镜像提高下载速度,例如豆瓣...
原创
发布博客 2018.07.03 ·
688 阅读 ·
0 点赞 ·
1 评论 ·
4 收藏

Pycharm

pycharm查找内容并替换内容
原创
发布博客 2018.07.03 ·
186 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

安装--charles--抓包工具

1.  搜索安装  charles  安装  创建快捷键到桌面2. 3.4.5.6.7.8.安装证书完毕   !!!!!!!!!
原创
发布博客 2018.06.09 ·
288 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多