python
yychenxie21
这个作者很懒,什么都没留下…
展开
-
linux下用python统计某个目录下指定后缀文件的个数
1,在这里用到了模块os 和os.path,os.walk()可以获得目录下的文件名,os.path.splitext()可以获得文件名的扩展名。这里是统计test目录下以.wav后缀的文件的个数#!/usr/bin/python#filename:traversefileInPythonimport osimport os.pathdir="/home/test"m=原创 2016-05-26 10:36:38 · 5945 阅读 · 0 评论 -
Linux下用python给某个目录下的wav文件创建相应的文本文件(标注文件)
1,在test目录下有多个wav文件,需要给每个wav文件创建相应的标注文件,比如有个1.wav,创建后的标注文件名为1.wav.trn,假设每个文件的内容都是"Hello,world,\n我喜欢你"。代码如下: #coding:utf-8 #因为代码中有中文,需要加上这句代码 #!/usr/bin/python #filename:traversefileInPython im原创 2016-05-26 13:43:11 · 1587 阅读 · 0 评论 -
python中的目录递归的创建和目录及其下的文件递归的删除
1,删除目录data下的train及其下的所有文件,相当于linux中的rm -rfimport shutilshutil.rmtree('data/train')2,递归的创建目录data/train,相当于Linux中的 mkdir -pimport osos.makedirs('data/train')原创 2016-05-26 19:18:34 · 8215 阅读 · 0 评论 -
Linux下用python对文件内容按列进行排序-功能等同于Linux下的sort命令对文件内容进行排序
1,X.lab中的文件内容如下: hello,world ni,hao bu,hao hai,hai no,no排序后的内容如下: bu,hao hai,hai hello,world ni,hao no,no基本思想:先将文件内容读取到列表中,在列表中进行排序,再从列表原创 2016-05-27 09:23:22 · 5132 阅读 · 0 评论 -
Python-将文本中内容按行读入numpy中
问题:试着将文本text中的整形或浮点型数字内容提取到numpy数组中或列表中,可发现总是以字符串的形式存在,这样在进行数字内容处理时,总是不便的。当然对于其它类型的数据内容,有时也是需要以numpy的形式处理解决办法: 方法一: import numpy as np原创 2016-12-26 09:19:23 · 6141 阅读 · 0 评论 -
Python-按字典dict的键排序,并取出相应的键值放于list中
方法一: def dict_to_numpy_method1(dict): dict_sorted=sorted(dict.iteritems(), key=lambda d:d[0]) results=[value for key,value in dict_sorted]方法二: def dict_to_numpy_method2(dict):原创 2016-12-26 09:41:15 · 7967 阅读 · 0 评论 -
判断文件的每一行内容是否包含非中文字符-python
有的时候,我们在做自然语言处理时,需要去除非中文字符,只保留文本中的中文字符。 #coding:utf-8import sysimport rereload(sys)sys.setdefaultencoding('utf-8')if len(sys.argv)!=3: print "ERROR *************" print "Usage:{0} ".fo原创 2017-03-08 11:04:51 · 4553 阅读 · 0 评论 -
利用BosonNLP做中文分词
# -*- coding: utf-8 -*-from __future__ import print_function, unicode_literalsfrom bosonnlp import BosonNLPnlp = BosonNLP('your API token')result = nlp.tag('在伦敦奥运会上将可能有一位沙特阿拉伯的女子')for d in resul原创 2017-03-07 10:21:22 · 3688 阅读 · 2 评论