- 博客(761)
- 资源 (10)
- 收藏
- 关注
原创 Python3中遇到UnicodeEncodeError: 'ascii' codec can't encode characters in ordinal not in range(128)
在 linux服务器上运行代码报错: Python3中遇到UnicodeEncodeError: ‘ascii’ codec can’t encode characters in ordinal not in range(128) 但是在windows上面运行代码正常。 原因是因为:linux系统语言导致的。 查看了一下系统环境编码>>> import sys&...
2018-06-13 21:22:22 37000 9
转载 python numpy logic_and
>>> import numpy as np>>> np.logical_and(True, False)False>>> np.logical_and([True,False], [False,False])array([False, False], dtype=bool)>>> np.logical_and...
2018-06-10 00:12:07 1070
原创 numpy 对矩阵中Nan的处理:采用平均值
尽管我们可以将所有的NaN替换成0,但是由于并不知道这些值的意 义,所以这样做是个下策。如果它们是开氏温度,那么将它们置成0这种处理策略就太差劲了。 下面我们用平均值来代替缺失值,平均值根据那些非NaN得到。from numpy import *datMat = mat([[1,2,3],[4,Nan,6]])numFeat = shape(datMat)[1]for i in ...
2018-06-09 17:22:46 5686
原创 python PCA主成分分析进行降维度
#PCA对数据进行降维from numpy import *def confloat(x): r=[float(i) for i in x] return rdef loadDataSet(fileName, delim='\t'): fr = open(fileName) stringArr = [line.strip().split(delim) f...
2018-06-09 17:08:18 1830
原创 numpy中矩阵名.A的含义
python中一个matrix矩阵名.A代表将 矩阵转化为array数组类型.from numpy import *a=mat([[1,2,3],[4,5,6]])b=a.Aprint(type(a))print(type(b))结果:<class 'numpy.matrixlib.defmatrix.matrix'><class 'numpy.nda...
2018-06-09 13:44:26 3195
原创 Python数据可视化利器Matplotlib,如何绘制横向柱形图
Python绘图库Matplotlib中,横向柱形图主要通过barh函数绘制得到,该函数的使用方法与常见的纵向的柱形图绘制函数bar的用法相似。Axes.barh(y, width, height, left, align=’center’, **kwargs)或matplotlib.pyplot.barh(y, width, height, left, align=’center’,...
2018-06-06 22:03:36 27975 1
原创 numpy 根据一维矩阵array内容 ,创建矩阵
import numpya=numpy.array([1,2,3,4])b=a[numpy.mat([[1,1]])]print(b)输出: [[2 2]]
2018-06-06 16:53:27 956
原创 python 实现MFCC
语音数据:http://www.voiptroubleshooter.com/open_speech/american.html For this post, I used a 16-bit PCM wav file from [here]import numpyimport scipy.io.wavfilefrom matplotlib import pyplot as pltf...
2018-06-06 16:52:18 23524 29
原创 numpy.transpose()
numpy.transpose()是对矩阵按照所需的要求的转置,比较难理解,现以例子来说明import numpy as np a = np.array(range(30)).reshape(2, 3, 5) print ("a = ") print (a) print "\n=====================\n" print ("a.transpos...
2018-06-05 22:49:07 539
转载 np.linalg.norm(求范数)
linalg=linear(线性)+algebra(代数),norm则表示范数。函数参数x_norm=np.linalg.norm(x, ord=None, axis=None, keepdims=False) ①x: 表示矩阵(也可以是一维)②ord:范数类型向量的范数: 矩阵的范数:ord=1:列和的最大值ord=2:|λE-ATA|=0,求...
2018-06-05 22:41:38 725
转载 基于kaldi、thchs30 的离线中文识别
具体操作细节可查看一下网址:链接 第一步就是要跑通thchs30的例子,这是清华的中文语音识别例子第二部做本地识别可查看上面网址,不过有两处不对1、如下图所示地方要改成final.mat,上面网址的是12.mat 2、如下图所示地方也要改ac_model=${data_file}/models/$ac_model_type trans_matrix="" aud...
2018-06-04 14:43:30 2008
转载 kaldi在线语音识别bug解决
【问题描述】使用kaldi工具包进行在线语音识别,识别麦克风输入,输出识别结果。使用egs/voxforge/online_demo文件夹时,./run.sh –test-mode live输出portaudio failed to open the defalut stream【解决办法】分三步进行解决。1.首先检查linux系统录音功能是否可用:arecord命令,如are...
2018-06-04 14:29:42 1225
原创 Anaconda 管理python环境
1.升级conda 环境conda update conda2 . 安装conda 参考https://blog.csdn.net/th_num/article/details/800777623 .列出conda下面的环境conda info --envs其中前面带* 号,表示正在使用的环境4 .复制一个环境conda create --name pyth...
2018-06-04 14:16:43 289
原创 kalid 运行thchs30 报错 Caution: the last few frames of the wav file may not be decoded properly.
报出调试信息:Reads in wav file(s) and simulates online decoding.Writes integerized-text and .ali files for WER computation. Utterance segmentation is done on-the-fly.Feature splicing/LDA transform is ...
2018-06-04 13:09:55 391
原创 pyTelegramBotAPI Read timed out. (read timeout=30) Error
telegram 机器人 出现错误: File “/usr/local/lib/python3.4/dist-packages/telebot/apihelper.py”, line 54, in _make_request timeout=(connect_timeout, read_timeout), proxies=proxy) File “/usr/local/lib/python3...
2018-06-01 00:00:57 2419
转载 centos6 python 安装 sqlite 解决 No module named ‘_sqlite3′
出现 No module named ‘_sqlite3′ >>> import sqlite3Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/opt/Python-3.5.0/python350/lib/python3.5/sqli...
2018-05-25 23:13:25 924
转载 Linux 升级 Python 至 3.x
简述CentOS 7 中默认安装了 Python,版本比较低(2.7.5),为了使用新版 3.x,需要对旧版本进行升级。由于很多基本的命令、软件包都依赖旧版本,比如:yum。所以,在更新 Python 时,建议不要删除旧版本(新旧版本可以共存)查看 Python 版本号当 Linux 上安装 Python 后(默认安装),只需要输入简单的命令,就可以查看 Python 的版本号...
2018-05-25 23:06:47 932
原创 ubuntu 安装pip3 遇到Ignoring ensurepip failure: pip 8.1.1 requires SSL/TLS错误
3.5版本之后的会自动安装pip,所以我们直接从官网下载3.5.2,下载地址:https://www.python.org/ftp/python/下载以后,可以用命令解压,也可以右键进行解压,tar zxvf Python-3.5.2.tgz 切换目录cd Python-3.5.2准备安装./configure sudo make sudo make install这...
2018-05-25 13:52:26 2536 1
转载 Linux中文显示乱码?如何设置centos显示中文
怎么设置Linux系统中文语言,这是很多小伙伴在开始使用Linux的时候,都会遇到一个问题,就是终端输入命令回显的时候中文显示乱码。出现这个情况一般是由于没有安装中文语言包,或者设置的默认语言有问题导致的。查看当前系统语言登陆linux系统打开操作终端之后,输入 echo $LANG可以查看当前使用的系统语言。 输出: C查看安装的语言包查看是否有中文语言包可以在终端输入...
2018-05-25 13:47:43 2240
转载 Python3—UnicodeEncodeError 'ascii' codec can't encode characters in position 0-1
问题描述 使用python3的时候,报错信息 UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position 0-1: ordinal not in range(128)网上解释网上给出的解释:错误的使用decode和encode方法会出现这种异常。例如使用decode方法将Unicode字符串转化的时候:...
2018-05-25 13:40:49 5957
转载 解决vim编辑文件时中文乱码
在centOS或debian等Unix系统上,使用vim编辑文件时,输入中文时,中文乱码:vim /root/.vimrc输入如下配置:syntax on set fileencodings=ucs-bom,utf-8,utf-16,gbk,big5,gb18030,latin1 set fileencoding=utf-8 :wq再次vim编辑时OK。解...
2018-05-25 13:36:30 3248
原创 通过Pandas读取大文件
当数据文件过大时,由于计算机内存有限,需要对大文件进行分块读取:import pandas as pdf = open('E:/学习相关/Python/数据样例/用户侧数据/test数据.csv')reader = pd.read_csv(f, sep=',', iterator=True)loop = TruechunkSize = 100000chunks = []whi...
2018-05-24 16:28:13 1963
原创 Pandas 行列操作
行选择 不管何时,你调用了一个方法返回或者打印一个DataFrame时,最左边的一列必然是索引值,可以通过index属性来直接访问DataFrame的索引值。import pandas as pddf1=pd.DataFrame({'name':['kate','herz','catherine','sally'], 'age':[25,28,39,...
2018-05-24 16:24:37 909
原创 python---pandas.merge使用
merge 函数参数merge: 合并数据集, 通过left, right确定连接字段,默认是两个数据集相同的字段 参数 说明 left 参与合并的左侧DataFrame right 参与合并的右侧DataFrame how 连接方式:‘inner’(默认);还有,‘outer’、‘left’、‘right’ on 用于连接的列名,必须同时存在于左右两个DataFrame对...
2018-05-24 16:08:42 675
转载 pandas中apply函数的用法
apply函数可以对DataFrame对象进行操作,既可以作用于一行或者一列的元素,也可以作用于单个元素。例:列元素data=np.arange(0,16).reshape(4,4)data=pd.DataFrame(data,columns=['0','1','2','3'])def f(x): return x-1print(data)print(data.ix[:...
2018-05-24 15:51:30 2341
原创 python pandas消除空值和空格以及 Nan数据替换
在人工采集数据时,经常有可能把空值和空格混在一起,一般也注意不到在本来为空的单元格里加入了空格。这就给做数据处理的人带来了麻烦,因为空值和空格都是代表的无数据,而pandas中Series的方法notnull()会把有空格的数据也纳入进来,这样就不能完整地得到我们想要的数据了,这里给出一个简单的方法处理该问题。方法1:既然我们认为空值和空格都代表无数据,那么可以先得到这两种情况...
2018-05-24 13:47:57 71027
转载 数据库中的空值与NULL的区别以及python中的NaN和None
数据库里面的”空值”有两种:空字符(“”)、空值(NULL)。 两种存储方式在数据库中都很常见,实际中根据业务或者个人习惯可以用这两种方式来存储“空值”。那这两种到底有什么区别,下面通过例子直接来展示:-- 创建表testcreate table `test` (`id` int not null ,`name` varchar(255) null ,`date` tim...
2018-05-24 13:43:48 8917
原创 python numpy中nonzero()的用法
当使用布尔数组直接作为下标对象或者元组下标对象中有布尔数组时,都相当于用nonzero()将布尔数组转换成一组整数数组,然后使用整数数组进行下标运算。nonzeros(a)返回数组a中值不为零的元素的下标,它的返回值是一个长度为a.ndim(数组a的轴数)的元组,元组的每个元素都是一个整数数组,其值为非零元素的下标在对应轴上的值。例如对于一维布尔数组b1,nonzero(b1)所得到的是一个长...
2018-05-19 15:47:41 363
原创 python 的map与zip 函数
一、map函数首先Python中的map函数是很简单的。意为将第二个参数(一般是数组)中的每一个项,处理为第一个参数的类型。比如如下的代码,将a这个list的每一项都从int类型转化为str类型。#-*-coding:utf-8-*- a=[1,2,3]; print map(str,a); 运行结果如下: [‘1’,’2’,’3’] 而如下的数组,则对a这个二维数组中的...
2018-05-19 15:20:14 601
原创 linux screen
screen简介: 介绍:Screen是一个可以在多个进程之间多路复用一个物理终端的窗口管理器,每一个screen 称为一个session ,在每一个session上面可以创建多个窗口。 而且每一个session 可以离开,但不会终止session所运行的程序。会话命令1.创建一个session :screen -S [你的session命名]2.列出所有的session:...
2018-05-18 10:13:57 1881
转载 numpy的getA()/getA1()/getH()/getI()函数
1.mat.getA() 将自身矩阵变量转化为ndarray类型的变量。 等价于np.asarray(self) 原因: mat 不可以直接通过index访问元素,例如下面的mat[3][6]就会报错。a = np.mat([[1,2],[3,4]])aOut[251]: matrix([[1, 2], [3, 4]])a.getA()Out[252]...
2018-05-17 13:04:58 795
原创 set集合的合并
操作符|用于求两个集合的并集,这也是一个按位或(OR)操作符(参见附录C)。在数学符号表示上,按位或操作与集合求并操作使用相同记号。a=set([1,2,4])b=set([4,5,6])print a|b输出: set([1, 2, 4, 5, 6])...
2018-05-16 16:53:43 5546
原创 python pickle序列化存储
序列化存储:序列化对象可以在磁盘上保存对象,并在需要的时候读取出来。任何对象都可以执行序列化操作,字典对象也不例外。def storeTree(inputTree,filename): import pickle fw=open(filename,"w") pickle.dump(inputTree,fw) fw.close()def grabTree(f...
2018-05-16 15:40:47 397
原创 python matplotlib 画注解图
import matplotlib.pyplot as plt#使用文本注解绘制树节点#定义文本框和箭头格式decisionNode=dict(boxstyle="sawtooth",fc="0.8")leafNode=dict(boxstyle="round4",fc="0.8")arrow_args=dict(arrowstyle="<-")def plotNode(no..
2018-05-16 14:56:55 1338
原创 python 引用传值、赋值
python 数组 A=B 默认的是引用传值,改变A中的元素,B中的元素同样改变。 而A=B[:]则是传值,改变A中的元素的值,B中元素的值保持不变。样例: 引用a=[1,2,3,4]b=a[:]b[0]=4print(b)print(a)def Cal(A): B=[] B=A B[0]=4 return Ba=[[1,2,3,4]]...
2018-05-16 14:26:17 902
原创 python append和entend的区别
了Python语言列表类型自带的extend()和append()方法。这两个方法功能类似,但是在处理 多个列表时,这两个方法的处理结果是完全不同的。 假定存在两个列表,A和B:A=[1,2,3]B=[4,5,6]A.append(B)输出: [1, 2, 3, [4, 5, 6]] 如果执行a.append(b),则列表得到了第四个元素,而且第四个元素也是一个列表。然而 ...
2018-05-16 14:15:49 959
原创 python 列举文件夹下面的文件
#列举文件from os import listdirtrainningFileList=listdir('digits/testDigits')print(trainningFileList)
2018-05-16 10:44:42 667
原创 matplotlib 制作原始数据的散点图
import numpy as npimport matplotlib.pyplot as pltreturnMat=np.array([[1,2],[3,4]])fig=plt.figure()ax=fig.add_subplot(111)ax.scatter(returnMat[:,1],returnMat[:,2])plt.show()
2018-05-15 21:54:26 785
原创 numpy sorted对字典进行排列
import operatorimport numpy as npdia={'A':2,'B':1}#对字典值进行排序sortDia=np.sorted(dia.iteritems(),key=operator.itemgetter(1),reverse=True)print(sortDia)
2018-05-15 21:31:16 1509
McGrawHill_-_Machine_Learning_-Tom_Mitchell课后答案
2016-04-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人