自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

mx_windforce的专栏

不积跬步,无以至千里;不积小流,无以成江海。

  • 博客(26)
  • 收藏
  • 关注

原创 使用kaldi进行语音自动切分、模型训练和强制对齐

这里,主要介绍一下网上的教程,经过一步步实验,对某些可能让人容易误解的地方进行注释。1. 只有原始录音和音素标注,进行初次以及多轮的单音素、三音素模型训练,并且基于这些模型进行语音切分:http://pages.jh.edu/~echodro1/tutorial/kaldi/kaldi-training.html手工实验下来,只有两个地方略微不同。1. 网上谈到要在lexico

2017-06-17 23:57:19 14496 2

原创 如何在linux shell中输入制表符tab

按住ctrl再按v再按i

2017-06-16 23:51:56 16233 3

原创 使用swig包装C或C++源代码在windows下用命令行编译并用distutils打包供python使用

一、文件:手写了三个文件:1. add_function.h:float add_function(float, float);2. add_function.c:float add(float a, float b){    return a+b;}3. add_function.i:/* file: add_function.i */

2017-04-05 16:21:15 1669

转载 intelij idea: Exception in thread "main" java.lang.ClassNotFoundException

http://www.cnblogs.com/do-better/p/5864165.html从网上搜了好多,大多是说,在类里边是不是没有main函数,而且强调了main函数的写法: public static void main(String[] args)还有人说了classpath的问题,是不是找不到那个类,等等。其实,我使用的是intelij idea,也看了书,知道main该

2016-12-18 22:24:14 17508 10

转载 svn:总使用最新数据忽略个人修改

来源:http://stackoverflow.com/questions/3709197/is-it-possible-to-always-force-overwrite-local-changes-when-updating-from-svn有时候,尝试别人的代码,会添加一些文件,或者对代码做一些改动,但是又不想影响owner,每次都拉取最新的数据,那么使用下述方法:

2016-11-03 19:07:55 496

原创 给anaconda设置代理来访问包来源

公司为了安全,网络连接外网需要设置代理。因此,如果不设置代理,将无法访问anaconda等python包的来源。代理设置有两种方法:1. 先使anaconda允许pip来访问包管理,然后在pip命令中加入代理的参数。1. 允许pip访问包管理:conda config --set use_pip True2. pip命令中加参数:pip --proxy http://XXXXX.com

2016-11-02 13:11:38 21583

原创 python实现多进程_multiprocessing

按照我的习惯,写了一个Python进行多进程处理的模板。

2016-10-30 23:59:23 1765

原创 在windows使用py2exe打包程序

直接贴出我用的一个,备忘。注意哪些exlude和include,这些是查了资料之后才知道要添加的内容,不然build不成功。目前,原理已经忘记,先这样用着。#!/usr/bin/env python# -*- coding:utf8 -*-from distutils.core import setupimport py2exe, sys, ossys.argv.append('p

2016-09-20 10:39:19 469

原创 搭建使用numpy, scipy, scikit-learn的环境

在windows上安装和更新scipy是很痛苦的。而要安装scikit-learn又必须安装好指定版本的numpy和scipy。所以,很头疼。我本来使用的是activepython,用pypm来管理package,不过pypm更新的太慢了,很多包都很老。于是,我下载使用pip来进行包管理,但是在安装scipy时又编译不过去,因为缺少其他的底层包。而且,编译scipy等需要用到C的编译器,在wi

2016-08-25 16:45:56 1264

原创 当类中含有logging等流数据时,使用pickle打包与装载类对象数据

由于pickle打包不允许对象中有流数据,所以,如果待打包的类对象中含有logging的对象时,打包不会成功。但是在类中添加logging对象来输出日志比较方便实用,那么如何解决这种冲突呢?需要手工重写自己的类的__getstate__和__setstate__函数,在__getstate__函数中,返回一个不含有流数据变量的字典,这样就可以打包,在日后装载数据后,再手工在__dict__中添加该

2016-05-25 18:06:57 397

转载 使用py2exe将python脚本整体打包为一个exe的方法

http://stackoverflow.com/questions/112698/py2exe-generate-single-executable-file#113014以上链接是英文解答原文。现将核心代码拷贝到这里,如果不熟悉使用py2exe打包,请先搜索简单的py2exe的用法。from distutils.core import setupimport py2exe, sys,

2016-05-23 13:03:42 845

原创 openproj不能修改日期的原因分析与解决

问题:先使用openproj指定计划,安排人手在规定时间内完成某件事情,结果在实施过程中,由于各种情况,实际完成的时间很可能与计划时间不同,或快或慢。那么我们需要更改时间,记录已经完成的部分,同时修改接下来的事情。但是在openproj中经常无法修改时间,总是跳回去。google了一下,发现很多人问这个问题,但是大多说是bug,极少人指出这是不了解项目管理导致的。我摆弄了一天,发现,至

2016-05-18 15:29:08 4466

原创 使用sed过滤提取文本中的信息

sed -r -n -e '/ERROR/p' mntenu_check.log | sed -r -e '/\[.{8}\.mlf\]/!d' | sed -r -e 's/.*\[(.{8})\.mlf\].*/\1/g' | uniq > filenamesTobeRemoved.log1. 第一步,在文件中将含有"ERROR"字符串的行输出。-n 与p的配合使用2. 第二步

2016-05-17 14:23:51 1857

原创 使用py2exe来打包python脚本到exe程序

#!/usr/bin/env python# -*- coding:utf8 -*-from distutils.core import setupimport py2exesetup(windows=['test_maiwindow.py'], options = { "py2exe": { "dll_excludes": ["MS

2016-05-12 15:53:03 649

原创 使用tar和gzip对某文件夹内的某类型文件进行压缩与解压缩

有时候,需要对某个文件夹内的某个类型的文件进行压缩。由于使用tar压缩时会把绝对路径也压缩进去,这时解压缩则会多出这些文件夹结构,很麻烦,那么使用如下命令:tar -C /dir1/dir2 -czvf /dir3/dir4/my.tar.gz *.ext1解释如下:1. -C 表示要压缩的文件在/dir1/dir2内,这样压缩后,只有ext1类型的文件,而没有/d

2016-05-11 17:53:41 5985

原创 linux下用grep查找文件夹内含有某字符串的文件

有时候,需要查看哪些文件含有指定的字符串,然后拷贝或者删除。可以使用grep或者egrep来实现。比如,查找含有\TE\的文件名,只列出文件名grep -rnl "\\\\TE\\\\" **表示当前目录的所有文件和子文件夹。所以,可以替换为某个文件夹名或者指定的文件名-r 表示递归查找-n 表示删除行号-l 表示只输出文件名-L 表示只输出不含有该字符串的文件名

2016-03-02 16:08:09 2818

原创 编程思路感想(1)

第一个问题,处理数据过程中,经常会遇到数据格式不规范或者内容不符合逻辑等导致程序无法通过,这时候一般有两种想法:1. 我要把错误的地方准确定位,具体到某个文件,某一行,某种错误,直接导致错误的变量的值。2. 我要先略过该错误,进行与错误无关的处理,得到一个初步的处理结果,等有时间的时候再回过头来检查数据的问题。怎么办呢?我用python编程,觉得可以用抛出与接收异常这种机制来处

2016-03-02 15:32:04 383

原创 awk循环处理文本进行统计

由于awk对于标准格式文本可以快速分割,因此我有时候懒得用python再去写更长的脚本去做一些简单的统计和打印工作。比如,现有文本为对一些符号的分类:pre_groups:CH_DTL = z c s ìpre_groups:CH_RTR = Z C S r î用集合的语言来说,我希望,该分类满足:1. 完备性:所有的元素必须属于某一个分类。2. 唯一性:所有的元素仅能

2016-02-26 11:34:27 3859

原创 linux下递归修改子目录内的文件名

有时候,需要修改某个文件夹内的所有某个扩展名的文件的文件名,比如大小写互转。那么我们就需要获取所有的相关文件名,然后进行重命名。获取相关文件名的绝对路径名可以用find命令,而修改文件名则使用mv命令,至于循环的处理,则只能使用awk这种程序语言来进行处理。例子:当前文件夹下,所有以.PCM为扩展名的文件都是大写,我们要把它们都转为小写。命令为:$ find $PWD -regex .*P

2016-01-29 14:20:15 7053

原创 awk中调用系统命令批量处理

工作中经常遇到在输入一堆文件名的条件下,将其移动或者删除或者复制。由于输入是个文件名的集合,而不是单个文件,因此不能直接用cp或者mv命令,可以通过awk的逐行处理的功能来处理这种情况。以下是一个例子:$ grep -r 'TE' * | cut -d " " -f3 | awk '{system("mv "$1" ./English_mlfs/")}'1. grep,在当前文件夹内的

2016-01-27 17:56:12 2071

原创 使用find在目录中查找文件的常用用法

有时候要找几年前存在电脑里的文件,不但位置忘记了,就连文件名都忘记的差不多了,怎么办?可以使用linux或者cygwin下的find命令,只要对文件名还有一些印象,就可以。1. 使用正则表达式。正则表达式实在是字符串匹配最好用的东东了,无论是用grep和sed在文件中查找符合条件的行,还是使用find来查找符合条件的文件名,都要用到正则表达式,灵活!怎么使用呢,很简单,使用选项-reg

2016-01-14 15:02:01 1618

原创 如何在grep和sed命令中使用扩展的正则表达式

对于grep,可以使用egrep命令来替代,那么就支持扩展的正则表达式了。对于sed,只要加上参数-r就可以支持扩展的正则表达式了。由于平时写python用的正则表达式大部分都是扩展的正则表达式,所以,出于习惯,我喜欢更自由的扩展的正则表达式,使用起来不用去考虑是否支持的问题。以下是使用的例子,假设有一堆文件,内容都是诸如:snme0001 今天心情不错!stta000

2016-01-13 15:24:09 3395

原创 遍历文件夹内所有文本文件,查找含有某种模式的行,合并到一个文件

例子:当前文件夹下有一堆文本文件,其内容的格式都是如下:snme0001 我心情很好啊!句子ID和文本之间是tab。我想把文本不含英文的行都抽取出来放到一个新的文件中,比如"abc.txt“。grep -r '[[:alpha:]]\{4\}[[:digit:]]\{4\}' * | cut -d ":" -f2 | grep -v '[[:alpha:]]\{4\}[[:

2016-01-11 14:59:03 1414

原创 [mercurial] web server搭建过程及相关问题的解决

最近,有一项工作需要和实习生一起完成。该工作主要是检查数据,

2014-10-11 09:48:06 1032

原创 python中re的常见用法总结(update)

1. look_ahead or look_after:i) 当且仅当某类字符串之前符合某条件时,才把该字符串替换为另一类字符串。    如:当“$51%r" 前为 |, -, % 或者-*时,把其替换为a51%r.           re.sub((?   注意: look_ahead里的模式要求,模式匹配的字符串必须是固定宽度的。比如上例都是2个字符。必须用”.-"和“.

2013-06-03 15:41:23 1562

转载 python中整数,浮点数和字符串的转换

一. int()1.  将符合整数格式的字符串转换为整数。2.  将浮点数转换为整数,只是简单的取整,并非四舍五入。如: int("589") == 589         int(4.56) == 4二. float()1.  将符合浮点数格式的字符串转换为浮点数。2.  将整数转换为浮点数。如: float("45.6") == 45.6

2013-06-02 23:14:56 54595

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除