彭世瑜的博客

记录我的code历程 个人主页:www.pengshiyu.com

jinja2: Can't perform this operation for unregistered loader type

代码: # -*- coding: utf-8 -*- from jinja2 import Environment, PackageLoader env = Environment(loader = PackageLoader('app', 'templates')) template...

2018-07-30 17:12:48

阅读数:74

评论数:0

mysql:insert ignore、insert和replace区别

指令 已存在 不存在 举例 insert 报错 插入 insert into names(name, age) values(“小明”, 23); insert ignore 忽略 插入 insert ignore into name...

2018-07-30 11:18:30

阅读数:62

评论数:0

Python爬虫:关于scrapy、Gerapy等爬虫相关框架和工具

框架名称 作用 地址 scrapy 爬虫框架 https://github.com/scrapy/scrapy Scrapyd 部署启动、状态监控 https://github.com/scrapy/scrapyd Scrapyd-Cli...

2018-07-27 22:20:51

阅读数:143

评论数:0

Python数据科学:Numpy库一些简单区分

x, y, z 对应的shape元组是从右往左数的,即从左往右是z, y, x 抽象座标轴顺序从左向右。指定哪个轴,就只在哪个轴向操作,其他轴不受影响。 在索引中出现冒号(:),则结果中本轴继续存在,如果只是一个数值,则本轴消失。 ndarray 的数据在内存里以一维线性存放,resha...

2018-07-27 22:02:20

阅读数:27

评论数:0

Python爬虫:selenium打开新窗口和多窗口切换

网上说可以通过发送按键事件触发,比如ctrl+T,不过我没成功,使用了js打开新窗口的方式 代码示例 # -*- coding: utf-8 -*- # @File : switch_tab.py # @Date : 2018-07-27 # @Author : Peng Sh...

2018-07-27 16:46:45

阅读数:1292

评论数:0

临时邮箱email网址收集

名称 地址 10 分钟邮箱 https://temp-mail.org/zh/ 10 分钟邮箱 https://10minutemail.net/?lang=zh-cn 60 分钟邮箱 https://www.guerrillamail.com/...

2018-07-26 18:44:00

阅读数:6189

评论数:0

Python编程:小组技术分享会之is和==

# 字符串是不可变类型 s = "pig" """ id(s) Out[18]: 4355286776 ""&...

2018-07-26 10:29:50

阅读数:43

评论数:0

Python爬虫:网络信息爬取与处理知识梳理

HTTP协议 应用层协议 无状态:每次连接,传输都是独立的 无连接:每次连接只处理一个请求 HTTP请求 GET:没有request body POST: 有request body HTTP状态码 2xx:成功 3xx:跳转 4xx: 客户端错误 403 Forbid...

2018-07-25 22:45:00

阅读数:157

评论数:1

Python爬虫:正文提取第三方库goose

正文提取库goose,效果不是太好,要求不高的话可以试试用 github:https://github.com/grangier/python-goose 安装 git clone https://github.com/grangier/python-goose.git cd python-...

2018-07-25 22:43:50

阅读数:299

评论数:0

SyntaxError: Missing parentheses in call to 'print'

python3使用了python2的语法,换python2就行

2018-07-25 22:21:39

阅读数:56

评论数:0

Python数据科学:Numpy库基础

argsort函数 返回的是数组值的索引值 import numpy as np x = np.array([3, 1, 4, 2, 5]) # 从小到大 np.argsort(x) Out[4]: array([1, 3, 0, 2, 4]) # 从大到小 np.argsort(-x)...

2018-07-25 13:41:57

阅读数:39

评论数:0

机器学习:SVM(Support Vector Machine)支持向量机简介

SVM(Support Vector Machine): 支持向量机 有监督学习模型 应用:模式识别、分类以及回归分析 SVM的主要思想: 它是针对线性可分情况进行分析,对于线性不可分的情况,通过使用非线性映射算法将低维输入空间线性不可分的样本转化为高维特征空间使其线性可分,从而使得高...

2018-07-25 13:01:59

阅读数:28

评论数:0

机器学习:指数函数和对数函数简单区别

区别 指数函数 对数函数 英文 exponential logarithm 函数 y=a^x (a>0,且a≠1) y=logax(a>0,且a≠1) 定义域 实数集R ...

2018-07-25 12:51:11

阅读数:128

评论数:0

Python编程:qrcode库生成二维码

安装 pip install qrcode[pil] pipy:https://pypi.org/project/qrcode/ github:https://github.com/lincolnloop/python-qrcode 代码示例 import qrcode i...

2018-07-25 11:30:48

阅读数:50

评论数:0

Python爬虫:使用lxml解析网页内容

安装 pip install lxml 代码示例 from lxml import etree text = """ <html> <head&...

2018-07-24 23:07:02

阅读数:143

评论数:4

Python编程:cookiejar的使用

CookieJar类的子类: CookieJar:管理HTTP cookie值、存储HTTP请求生成的cookie、向传出的HTTP请求添加cookie的对象。整个cookie都存储在内存中,对CookieJar实例进行垃圾回收后cookie也将丢失。 FileCookieJar:从Cooki...

2018-07-24 15:14:49

阅读数:220

评论数:0

Python爬虫:scrapy管理服务器返回的cookie

1、使用cookie settings.py启用 COOKIES_ENABLED=True # 启用cookie COOKIES_DEBUG=True # 显示发送和接受的cookie 2、使用自定义cookie 如果要使用登录验证的cookie,那么可以这样 for url in ...

2018-07-24 15:01:04

阅读数:136

评论数:0

加速播放百度云内的视频

测试平台: windows chrome 在百度云播放页,打开console,快捷键ctrl + shift + i 输入: document.getElementById('html5player_html5_api').playbackRate=1.5 说明: playbac...

2018-07-23 22:40:04

阅读数:821

评论数:0

关闭jieba结巴分词日志输出

使用结巴分词,会输出如下日志: Building prefix dict from /usr/lib/python2.7/site-packages/jieba/dict.txt ... Loading model from cache /tmp/jieba.cache Loading mode...

2018-07-23 19:00:06

阅读数:280

评论数:0

Python爬虫:scrapy中间件及一些参数

scrapy中间件 from scrapy.settings import default_settings 'scrapy.downloadermiddlewares.robotstxt.RobotsTxtMiddleware': 100, 'scrapy.downloadermiddle...

2018-07-22 22:39:25

阅读数:160

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭