自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(36)
  • 资源 (12)
  • 问答 (1)
  • 收藏
  • 关注

原创 数据库

SQL sqlalchemy 初始化数据库 sqlite sqlalchemy query sqlalchemy session sqlalchemy filter sqlalchemy Column ElementsSQL性能提升orm http://docs.sqlalchemy.org/en/latest/orm/tutorial.html http://python

2018-01-11 15:43:31 753

翻译 selenium入门

1.简单的例子from selenium import webdriver # 导入浏览器驱动,用来连接浏览器from selenium.webdriver.common.keys import Keys # 按键捕捉driver = webdriver.Firefox() # 创建火狐浏览器的实例driver.get("http://www.python.org") # ...

2018-01-31 10:07:22 1091

原创 网页数据采集策略

1.非结构化数据 正则表达式(re) Xpath(lxml) css选择器(bs4) 2.结构化数据 json(json) xml 3.动态html 动态页面 ajax:分析xhr javascript,jquery:请求的数据都是js加载之前的,所以要解析js(困难),或执行js(selenium)tips: 1.在使用css选择器时如何定位 通过find_all()

2018-01-31 09:26:11 1086

原创 opencv 安装

下载对应包 https://www.lfd.uci.edu/~gohlke/pythonlibs/#opencv安装pip install opencv_python‑3.4.0‑cp36‑cp36m‑win_amd64.whl导入测试 import cv2

2018-01-30 14:02:42 381

原创 python time

方法 描述 time.sleep(secs) 睡眠 time.time() 以秒为单位返回作为浮点数的时间。 localtime() 将时间戳转化为struct_time time.mktime(t) 将struct_time转换为时间戳 time.strftime(format[, t]) 将struct_time转换为...

2018-01-29 18:06:04 446

翻译 ImageDraw

例子 画出一个灰色的线from PIL import Image, ImageDrawim = Image.open("hopper.jpg")draw = ImageDraw.Draw(im)draw.line((0, 0) + im.size, fill=128)draw.line((0, im.size[1], im.size[0], 0), fill=128)del

2018-01-26 17:13:58 559

翻译 pillow 入门

image类创建一个image类from PIL import Imageim = Image.open("hopper.ppm")查看类的相关信息print(im.format, im.size, im.mode) # format标识了图像的来源,如果不是读取文件获得的图像返回None显示图像im.show()读写图像image.open(i

2018-01-26 14:03:20 379

翻译 pillow 图像 基本概念

1.bands(通道) 每张图片都有多个通道组成,RGB图片有三个通道,分别是R通道,G通道和B通道.灰度图只有一个通道. 通过getbands()可以获得该图片具有的通道都是什么 2.mode(模式) 像素的宽度 模式 描述 1 1bit像素,黑白 L 8bit像素,表示黑白 P 8bit像素,可以使用调色板映射到其他模式 R

2018-01-26 13:39:54 759

原创 pillow api

静态方法 方法 描述 PIL.Image.open(fp, mode=’r’) 传入文件路径(str),返回一个image对象 PIL.Image.alpha_composite(im1, im2) 混合两个图片 PIL.Image.blend(im1, im2, alpha) 通过对两个图片插值生成新的图片 PIL.Image.com

2018-01-26 10:43:25 1268

转载 SQL性能提升

参考文献: https://wenku.baidu.com/view/65edd6f39e314332396893a7.html

2018-01-18 10:43:31 226

原创 requests与bs4编码

在使用requests库时,response对象的.text属性r.text 默认的response对象的encoding属性是None,所以在调用r.text解码的时候,request会猜它的编码 If Response.encoding is None, encoding will be guessed using chardet.encoding = None Enco

2018-01-17 14:32:01 1190

翻译 ls-files

git-ls-files - Show information about files in the index and the working tree查看所有的跟踪的文件git ls-files [-z] [-t] [-v] (--[cached|deleted|others|ignored|stage|unmerged|killed|modified])*

2018-01-16 17:49:51 517

原创 opencv

tesseract opencv 安装pillow 入门 pillow API pillow 图像 基本概念 ImageDraw

2018-01-16 14:59:27 858

原创 tesseract库

linux 安装$sudo apt-get tesseract-ocr设置环境变量 $export TESSDATA_PREFIX=/usr/local/share/win 安装1.下载网址 https://github.com/UB-Mannheim/tesseract/wiki 2.安装注意选择可用的语言 2.添加tesseract环境变量 E:\Progra

2018-01-16 14:58:00 964

原创 selenium

查看selenium支持的浏览器from selenium import webdriverhelp(webdriver) android (package) blackberry (package) chrome (package) common (package) edge (package) firefox (package) ie (package) ope...

2018-01-16 14:00:12 318

原创 request.post

requests.postrequests.post(url, data=None, json=None, **kwargs) 参数 类型 描述 url 字符串 请求的网页,对应的是form的action属性的值,而不是form所在的页面 data 字典 key是form的name属性对应的值,value是所填入的值,通过chrome审查元

2018-01-16 10:30:01 5258

原创 jupyter

Shift + J 或 Shift + Down 选择下一个cell。 Shift + K 或 Shift + Up 选择上一个cell。 Shift + M 合并cell。 Esc + F 在代码中查找、替换。%matplotlib inline # 作图显示 %run #运行外部代码 %load #插入代码 %store #在不同notebook之间传递变量 %who # 输出所有

2018-01-16 10:18:44 670

原创 字节(bytes) 二进制序列类型

字节的表示方法单引号 b’still allows embedded “double” quotes’ 双引号: b”still allows embedded ‘single’ quotes”. 三引号: b”’3 single quotes”’, b”“”3 double quotes”“”字节相关方法字节一般用16进制表示 方法 参数 描述 bytes.fromhex(str

2018-01-15 15:17:16 4053

翻译 sqlalchemy Column Elements

| 方法 | 参数 | 返回 | 描述 || -- | -- | -- | -- || and_(*clauses) | 条件 | | 且,and_(User.name == “wang”,User.id ==1) || any_(expr) | | | || asc(c

2018-01-15 14:22:25 328

翻译 sqlalchemy filter

方法 orm equals query.filter(User.name == ‘wang’) not equals query.filter(User.name != ‘wang’) LIKE query.filter(User.name.like(‘%ed%’)) IN query.filter(User.name.in_([‘ed’, ‘wendy’, ‘ja

2018-01-15 13:28:10 1880

原创 sqlalchemy session

sessionmaker()class sqlalchemy.orm.session.sessionmaker(bind=None, class_=class 'sqlalchemy.orm.session.Session'>, autoflush=True, autocommit=False, expire_on_commit=True, info=None, **kw)# glob

2018-01-15 13:19:17 1070

翻译 sqlalchemy query

方法 参数 返回 描述 all() list 返回所有查询的对象,list列表里是查询的对象地址 count() 使用from sqlalchemy import func来代替 filter(*criterion) User.name==’wang’, User.id>3 first() 单个查

2018-01-15 11:43:45 1692

翻译 wordcloud

安装词云 pip install wordcloud构建词云对象class wordcloud.WordCloud(font_path=None, width=400, height=200, margin=2, ranks_only=None, prefer_horizontal=0.9, mask=None, scale=1, color_func=None, max_words...

2018-01-12 16:59:55 661

原创 词频统计

import jiebastopwords = [line.strip() for line in open("./stopwords.txt", 'r', encoding='utf-8').readlines()] # 获得停词表,停词表可以在网上搜集def word_counts(text): seg_list = jieba.cut(text) # 使用结巴对文本分词

2018-01-12 15:29:15 828

原创 自然语言处理

TF-IDF词频统计 词云百度 自然语言处理API

2018-01-12 15:22:04 617

原创 python 字符串

方法 描述 str.capitalize() 返回副本,首字母大写,其余小写 str.upper() 全部大写 str.center(width[, fillchar]) 返回长度为width的字符串,并使得自身居中。 str.count(sub[, start[, end]]) 返回在[start, end]范围内的子串sub非重叠...

2018-01-12 13:30:25 491

原创 SQLite

命令 描述 .databases 列出该数据库的路径 .dbinfo 该数据的详细信息 .exit 退出 .fullschema 查看所有表的详细信息 .help 查看帮助信息 .open 打开新的数据库 .quit 退出 .show 查看数据库的配置 .tables 查看所有的表

2018-01-12 10:56:14 317

原创 sqlalchemy 初始化数据库

初始化数据库 方法1from sqlalchemy import create_engine, MetaDataengine = create_engine('sqlite:///foo.db', echo=True)metadata = MetaData(engine)metadata.create_all()方法2from sqlalchemy import c

2018-01-12 10:33:30 3041

原创 结构化查询语言

1.Data Definition Language, DDL 1.1 数据库操作 CREATE CREATE DATABASE db_name; //创建数据库SHOW SHOW DATABASES; //查询现在有哪些数据库DROP DROP DATABASE db_name; //删除数据库ALTER ALTER DATABASE db_name CHARACTER

2018-01-11 18:25:41 436

原创 setTimeout

var timeoutID = scope.setTimeout(function[, delay,param1, param2...]); var timeoutID = scope.setTimeout(function[, delay]); var timeoutID = scope.setTimeout(code[, delay]); 参数 描述 function 函数名(

2018-01-11 14:27:47 232

原创 同步和异步

回调在讲异步和同步的时候先要了解什么是回调function a(){ console.log("a");}function b(){ a();}b();执行b函数,实际上是再次调用了a函数。setTimeout方法同步和异步同步是指函数按照由上往下的顺序执行,当前一个函数没有执行完的时候,后面的函数是不能执行的。 异步是指函数可以不按照由上

2018-01-11 14:26:01 328

原创 协程

当遇到I/O阻塞时,协程会自动切换到其他的协程上,然后等I/O完成时再切换回来。import geventdef foo(): print('foo1') gevent.sleep(0) print('foo2')def bar(): print('bar1') gevent.sleep(0) print('bar2')gevent.

2018-01-11 13:30:59 289

原创 scapy spider.start_requests

class multiprocessing.Process(group=None, target=None, name=None, args=(), kwargs={}, *, daemon=None) 参数 说明 target 参数,传入调用方法 name 字符串,给进程命名 arg 元组,传入方法的参数 kwargs 字典,传入

2018-01-11 13:21:00 545

原创 sql导入导出

class threading.Thread(group=None, target=None, name=None, args=(), kwargs={}, *, daemon=None) 参数 说明 target 参数,传入调用对象 name 参数,传入方法 arg 元组,传入方法的参数 kwargs 字典,传入方法的参数

2018-01-11 13:15:30 500

原创 reveal.js

结构section>Single Horizontal Slidesection>section> section>1.1section> section>1.2section>section>section>2section>展示动画section>slide 1section> sec

2018-01-05 14:57:44 315

原创 vim emmet插件

```c-y>, 展开简写式c-y>d Balance a Tag Inward(选中包围的标签?)c-y>D Balance a Tag Outwardc-y>n 进入下个编辑点c-y>N 进入上个编辑点c-y>i 更新img>图像尺寸c-y>m 合并文本行c-y>k 删除标签c-y>j 分解/展开空标签c-y>/

2018-01-05 13:39:59 763

opencv_yolo3.part1.rar

opencv和yolo3的结合,因为需要用到权重等文件,比较大,所以分开打包,这是part1.

2019-08-20

opencv_yolo3.part2.rar

opencv和yolo3的结合,因为需要用到权重等文件,比较大,所以分开打包,这是part2.

2019-08-20

IDE直接和hadoop集群连接

hadoop可以使用IDE直接和集群连接,这样就可以直接在ide里进行测试了

2019-03-20

Win本地测试hadoop

Windows本地来测试hadoop的文件,方便进行快速的开发和迭代

2019-03-20

Linux提交hadoop任务

linux上传hadoop任务,总共包含了三个文件,分别是mapper,reducer,和jobsubmitter

2019-03-20

tesseract软件包

tesseract开发的工具包,包含了tesseract安装包,字体训练工具,以及一些验证码的样例

2018-10-10

java8安装包jdk-jre

-java8的开发环境

2018-10-10

文本挖掘资源

https://catalog.data.gov/dataset/consumer-complaint-database

2018-04-18

utf-8 unicode编码表

所有的utf-8 unicode编码,都可以在表里面查询,方便进行文本处理.

2018-03-26

linux tmux原版参考手册

tmux 英文参考手册

2017-06-14

iris数据集

博客里用到的数据集

2017-02-26

2016最新中国行政区划分

来源:国家统计局设管司 发布时间:2016-08-09 11:28 发布地址:http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201608/t20160809_1386477.html 解压密码:http://blog.csdn.net/claroja 如有其他问题可以给我留言,或者联系我的QQ:63183535,亲手制作!

2016-12-12

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除