自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

周小董

万物互联,环环相扣。

  • 博客(44)
  • 资源 (1)
  • 收藏
  • 关注

原创 [728]TensorFlow快速入门

机器学习斯坦福课程机器学习 人工智能 博文链接汇总 学习资料:  https://www.tensorflow.org/get_started/tflearn相应的中文翻译:  http://studyai.site/2017/03/05/%E3%80%90Tensorflow%20r1.0%20%E6%96%87%E6%A1%A3%E7%BF%BB%...

2018-08-30 17:23:36 1176 2

原创 [391]matplotlib.pyplot中的hist函数

区分直方图与条形图: 条形图是用条形的长度表示各类别频数的多少,其宽度(表示类别)则是固定的; 直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。 由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。 条形图主要用于展示分类数据,而直方图则主要用于展示数据型数据 官方文档...

2018-08-30 17:21:54 36454 2

原创 [390]git使用总结

学习网站:https://www.liaoxuefeng.com/wiki/0013739516305929606dd18361248578c67b8067c8c017b000git initgit add README.mdgit commit -m "first commit"git remote add origin git@github.com:zhouxinfei/gits...

2018-08-28 17:59:00 324

原创 [389]python引入模块报错ValueError: attempted relative import beyond top-level package

解决方法:在文件中加入下面两行代码,使用绝对路径import sys,ossys.path.append(os.path.dirname(__file__) + os.sep + '../')在练习Python中package的相对导入时,即from . import XXXorfrom .. import XXX  时会遇到这样两个错误:SystemErro...

2018-08-28 17:02:02 59997 5

原创 [388]码云使用说明

码云如何上传项目码云上传项目,需要3个步骤:在码云网站建立一个空项目;把这个空项目拉到本地;把自己的项目放到这个空项目里面并提交。在码云的页面,点击右上角的加号 选择新建项目 在跳转的页面简要填写项目信息,除了名称和路径,其它是非必填的 创建好后,就会跳转到新项目界面,点击右边的克隆按钮,可以复制项目地址。 拿到地址后,还需要在本地生成一对公钥与私...

2018-08-28 16:59:12 5835

原创 [387]scrapy模拟登陆

scrapy有三种方法模拟登陆方式:直接携带cookies找url地址,发送post请求存储cookie找到对应的form表单,自动解析input标签,自动解析post请求的url地址,自动带上数据,自动发送请求1、携带cookies登陆githubimport scrapyimport reclass Login1Spider(scrapy.Spider): ...

2018-08-26 23:27:19 512

原创 [386]python之psycopg2操作PostgreSQL

psycopg2的安装安装方法1:1)使用psycopg2-2.4.2.win-amd64-py2.7-pg9.0.4-release.exe安装,下载地址:http://vdisk.weibo.com/s/Cd8pPaw56Ozys直接运行exe,不出错误,运行上边代码验证代码无错误,基本算是安装完成了。2)怎么卸载?2.1)找到安装目录:C:\Python27,发现下边...

2018-08-26 23:26:38 5508

转载 [385]python之struct模块

一、struct简介看到struct这么英文单词,大家应该并不陌生,因为c/c++中就有struct,在那里struct叫做结构体。在Python中也使用struct,这充分说明了这个struct应该和c/c++中的struct有很深的渊源。Python正是使用struct模块执行Python值和C结构体之间的转换,从而形成Python字节对象。它使用格式字符串作为底层C结构体的紧凑描述,进而...

2018-08-26 13:00:00 568

原创 [384]python之binascii模块

binascii模块包含很多在二进制和ASCII编码的二进制表示转换的方法。通常情况不会直接使用这些功能,而是使用像UU,base64编码,或BinHex封装模块。 binascii模块包含更高级别的模块使用的,用C语言编写的低级高效功能。#coding:utf-8import binasciia = b'worker'#先把worker转换成二进制数据然后在用十六进制表示b ...

2018-08-26 12:58:57 35721 1

原创 [383]python unicodedata用法

UCD是Unicode字符数据库(Unicode Character DataBase)的缩写。UCD由一些描述Unicode字符属性和内部关系的纯文本或html文件组成。UCD中的文本文件大都是适合于程序分析的Unicode相关数据。其中的html文件解释了数据库的组织,数据的格式和含义。UCD中最庞大的文件无疑就是描述汉字属性的文件Unihan.txt。在UCD 5.0,0中,...

2018-08-26 12:57:48 27008 1

转载 [382]定时任务JoBX(opencron升级版)

opencron文章链接:https://blog.csdn.net/xc_zhou/article/details/80950811升级日志V1.2.0 by 2018-xx-xx 1)支持Window端,实现全平台编译和安装 2)简化安装部署流程,提供三个脚本一键安装启动项目(build.sh,agent.sh,server.sh) 3)更换项目r...

2018-08-24 18:18:14 5895 1

转载 [381]gcc命令

gcc命令使用GNU推出的基于C/C++的编译器,是开放源代码领域应用最广泛的编译器,具有功能强大,编译代码支持性能优化等特点。现在很多程序员都应用GCC,怎样才能更好的应用GCC。目前,GCC可以用来编译C/C++、FORTRAN、JAVA、OBJC、ADA等语言的程序,可根据需要选择安装支持的语言。语法 gcc(选项)(参数)选项 -o:指定生成的输出文件; ...

2018-08-24 00:04:28 1848

原创 [379]linux安装Zookeeper

1、下载:http://zookeeper.apache.org/releases.html 当前stable版是:http://archive.apache.org/dist/zookeeper/stable/2、将文件解压到/usr/local/目录下tar -zxvf zookeeper.tar.gz -C /usr/local 进入到刚刚解压好的目录中,创建两个文件夹,...

2018-08-21 23:04:23 820

原创 [378]python(创建|删除|重命名|复制)文件和文件夹

Python对文件的操作还算是方便的,只需要包含os模块进来,使用相关函数即可实现目录的创建。主要涉及到三个函数1、os.path.exists(path) 判断一个目录是否存在2、os.makedirs(path) 多层创建目录3、os.mkdir(path) 创建目录直接上代码import osdef mkdir(path): # 去除首位空格 ...

2018-08-18 23:48:45 507

原创 [377]python画朵玫瑰花

from turtle import *import timesetup(600,800,0,0)speed(0)penup()seth(90)fd(340)seth(0)pendown()speed(5)begin_fill()fillcolor('red')circle(50,30)for i in range(10): fd(1) left(10)ci...

2018-08-18 23:43:38 10847 2

原创 [376]python之difflib、filecmp模块比较文件和目录

先用dir查看该模块中有哪些可以的类或者方法difflib模块最常用的2个类就是Differ和HtmlDiff'-' 第1个序列中出现'+ ' 第2个序列中出现' ' 两行相同' 增量差异'^' 字符差异HtmlDiff类用来将比较结果存到html文件中,一般用法就是实例化HtmlDiff类之后,调用其make_file方法对两个文件进行比较,之后调用open函数将比较结果写入到结果文件中。

2018-08-18 23:42:51 9457 6

转载 [375]python使用thrift操作Hbase

HBase添加、更新表数据1、在hbase shell中添加一行数据,命令如下:put 'tablename','row','colfamily:colname','value'向emp表中添加几行数据:put 'emp','1','personal data:name','lsj'put 'emp','1','personal data:city','zz'put '...

2018-08-17 14:23:19 719

原创 [374]python字典(Dictionary) setdefault()和update()方法

描述Python 字典 setdefault() 函数和get() 方法类似, 如果键不存在于字典中,将会添加键并将值设为默认值。语法setdefault()方法语法:dict.setdefault(key, default=None)参数key – 查找的键值。default – 键不存在时,设置的默认键值。返回值如果字典中包含有给定键,则...

2018-08-17 14:22:25 2609

转载 [373]python Flask入门(一)

Flask是一个Python编写的Web 微框架,让我们可以使用Python语言快速实现一个网站或Web服务。本文参考自Flask官方文档,大部分代码引用自官方文档。安装Flask首先我们来安装Flask。最简单的办法就是使用pip。pip install flask然后打开一个Python文件,输入下面的内容并运行该文件。默认访问localhost:5000,我们应当可以...

2018-08-10 16:49:03 249

原创 [372]python Schema一种优雅的数据验证方式

Schema是什么?不管我们做什么应用,只要和用户输入打交道,就有一个原则–永远不要相信用户的输入数据。意味着我们要对用户输入进行严格的验证,web开发时一般输入数据都以JSON形式发送到后端API,API要对输入数据做验证。一般我都是加很多判断,各种if,导致代码很丑陋,能不能有一种方式比较优雅的验证用户数据呢?Schema就派上用场了。 Schema非常简单,也就几百行的代码,最核...

2018-08-10 16:48:05 2869

转载 [371]python测试框架(pytest)

框架选择python的测试工具大全:  https://wiki.python.org/moin/PythonTestingToolsTaxonomypython主流的测试工具横向比较  http://docs.python-guide.org/en/latest/writing/tests/  http://pythontesting.net/test...

2018-08-09 18:26:57 1447

原创 [370]python简单实现基于VSM的余弦相似度计算

在知识图谱构建阶段的实体对齐和属性值决策、判断一篇文章是否是你喜欢的文章、比较两篇文章的相似性等实例中,都涉及到了向量空间模型(Vector Space Model,简称VSM)和余弦相似度计算相关知识。第一步,向量空间模型VSM向量空间模型(Vector Space Model,简称VSM)表示通过向量的方式来表征文本。一个文档(Document)被描述为一系列关键词(Term)的向...

2018-08-09 15:52:57 2604 1

原创 [369]python各类距离公式实现

所列的距离公式列表和代码如下:闵可夫斯基距离(Minkowski Distance)欧氏距离(Euclidean Distance)曼哈顿距离(Manhattan Distance)切比雪夫距离(Chebyshev Distance)夹角余弦(Cosine)汉明距离(Hamming distance)杰卡德相似系数(Jaccard similarity coefficient)...

2018-08-09 13:27:51 19216

原创 [368]python3 argparse模块

1、定义:argparse是python标准库里面用来处理命令行参数的库2、命令行参数分为位置参数和选项参数:位置参数就是程序根据该参数出现的位置来确定的 如:[root@openstack_1 /]# ls root/ #其中root/是位置参数选项参数是应用程序已经提前定义好的参数,不是随意指定的 如:[root@openstack_1 /]# ls -l # -l...

2018-08-06 18:07:15 267

原创 [367]python3之PrettyTable模块(美化库)

安装:pip install PrettyTable# -*- coding:utf-8 -*-from prettytable import PrettyTablex = PrettyTable(field_names=["name", "age", "sex", "money"])x.align["name"] = "l" # 以name字段左对齐x.padding

2018-08-06 18:05:58 12793 2

原创 [366]python docopt模块

安装:pip install docopt[root@shuffle-dev py_test]$ vim doc.py#!/usr/bin/env python# -*- coding: utf-8 -*-"""Naval Fate. Usage: doc.py ship new <name>... doc.py ship <name> mov...

2018-08-06 17:49:38 601

原创 [365]python读取word并保留原格式

参考:https://blog.51cto.com/u_16213448/8268498。最后,我们需要将读取到的表格数据输出到文件或者控制台。在这里,我们将数据输出到控制台。下面是一个完整的示例代码,演示了如何使用Python读取Word表格数据并保留原格式。在读取表格数据时,我们需要保留原始的格式,包括字体、颜色、对齐方式等。接下来,我们需要读取Word表格中的数据。首先,我们需要打开要读取的Word文件。库的Table对象和Cell对象来实现这一功能。对象来实现这一功能。这两句均是设置字体为。

2018-08-06 17:48:46 4969 1

原创 [364]python ast模块

我们知道python解析执行的过程大概是这样的: 词法分析 –> 具体语法树 –> 抽象语法树 –> 控制流图 –> 字节码 –> 执行其中,抽象语法树可以用ast模块建立出来.首先第一个问题是, 这个ast模块有什么用呢? ast提供了访问和修改上述中抽象语法树的功能.可以做一些比如测试,代码生成,静态分析等等. 比如pylint, pythons...

2018-08-06 17:47:54 12651

转载 [363]python中优雅的用法

枚举之前我们这样操作:i = 0for item in iterable: print (i, item) i += 1现在我们这样操作:for i, item in enumerate(iterable): print( i, item)enumerate函数还可以接收第二个参数。就像下面这样:>>> list(...

2018-08-06 17:46:59 224

原创 [362]win环境如何一下删除多个文件

按WIN键+R,输入CMD,打开命令提示符.到你要删的目录上.例如E盘Program Files目录的文件e: 进入E盘cd Program Filesdel *.exe /S /F 删除子目录下所有的.exe文件rd abc /S 删除abc目录,包括里面的所有目录和文件...

2018-08-06 17:46:18 850

原创 [361]python包管理工具setuptools

什么是setuptoolssetuptools是Python distutils增强版的集合,它可以帮助我们更简单的创建和分发Python包,尤其是拥有依赖关系的。用户在使用setuptools创建的包时,并不需要已安装setuptools,只要一个启动模块即可。try: from setuptools import setupexcept ImportError: ...

2018-08-06 17:45:38 1726

原创 [360]python的termcolor模块

termcolor是一个python包,可以改变控制台输出的颜色,支持各种terminal(WINDOWS的cmd.exe除外)。它支持下列的文字颜色: grey, red, green, yellow, blue, magenta, cyan, white支持下列的背景高亮: on_grey, on_red, on_green, on_yellow, on_blue, ...

2018-08-06 17:44:32 3213

原创 [359]python中的计时器timeit

通常在一段程序的前后都用上time.time(),然后进行相减就可以得到一段程序的运行时间,不过python提供了更强大的计时库:timeit#导入timeit.timeitfrom timeit import timeit #看执行1000000次x=1的时间:timeit('x=1')#看x=1的执行时间,执行1次(number可以省略,默认值为1000000):tim...

2018-08-06 17:43:42 327

原创 [358]python sys.path.append()和sys.path.insert()

python程序中使用 import XXX 时,python解析器会在当前目录、已安装和第三方模块中搜索 xxx,如果都搜索不到就会报错。 使用sys.path.append()方法可以临时添加搜索路径,方便更简洁的import其他包和模块。这种方法导入的路径会在python程序退出后失效。1. 加入上层目录和绝对路径import syssys.path.append('.....

2018-08-05 00:57:21 2569 2

原创 [357]python zip()方法

>>> name=('jack','beginman','sony','pcky')>>> age=(2001,2003,2005,2000)>>> for a,n in zip(name,age): print(a,n)输出:jack 2001beginman 2003sony 2005pcky 2000...

2018-08-05 00:24:56 1515

原创 [356]python next() 函数

描述next() 返回迭代器的下一个项目。语法next 语法: next(iterator[, default])参数说明:iterator – 可迭代对象 default – 可选,用于设置在没有下一个元素时返回该默认值,如果不设置,又没有下一个元素则会触发 StopIteration 异常。返回值返回对象帮助信息。实例以下实例展示了 ne...

2018-08-05 00:06:00 857

转载 [355]python3 OS文件/目录方法

os 模块提供了非常丰富的方法用来处理文件和目录。常用的方法如下表所示: 方法 描述 os.access(path, mode) 检验权限模式 os.chdir(path) 改变当前工作目录 os.chflags(path, flags) 设置路径的标记为数字标记。 os.chmod(path, mode) 更改权限 os....

2018-08-04 23:51:33 200

原创 [354]python os.path模块

os.path模块主要用于文件的属性获取,在编程中经常用到,以下是该模块的几种常用方法。更多的方法可以去查看官方文档:http://docs.python.org/library/os.path.htmlos.path.a*1、os.path.abspath(path) 返回path规范化的绝对路径。 >>> os.path.abspath('test.c...

2018-08-04 23:35:16 216

原创 [353]python3中新函数(gt,ge,eq,le,lt)替代Python2中cmp()函数

Python3中已经不能使用cmp()函数了,被如下五个函数替代:import operator #首先要导入运算符模块operator.gt(1,2) #意思是greater than(大于)operator.ge(1,2) #意思是greater and equal(大于等于)operator.eq(1,2) #意思是equal(等于)...

2018-08-04 23:30:42 9997

原创 [352]pybloom去重

环境python3.6pip3 install bitarray-0.8.1-cp36-cp36m-win_amd64.whl(pybloom_live依赖这个包,需要先安装)pip3 install pybloom_live下载地址:https://www.lfd.uci.edu/~gohlke/pythonlibs/1. pybloom_liveScalableB...

2018-08-01 22:12:06 1994 2

python3 使用 thrift 操作hbase 安装hbase-thirft后有一个Hbase报错

python3 使用 thrift 操作hbase 安装hbase-thirft后有一个Hbase报错 使用这个修改完成的Hbase类替换掉原来的Hbase类问题全部解决 主要是因为python版本兼容性带来的问题

2018-09-10

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除