自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 语义相似度的计算

语义相似度就是计算两个句子之间的相似度,可以将两个句子向量化之后,计算余弦距离。# -*- coding: utf-8 -*-"""Created on Thu Feb 21 20:18:38 2019@author: lcl"""from sklearn.feature_extraction.text import CountVectorizerimport mathimpor...

2020-06-29 11:53:52 113

原创 python接口调用 get/post

调用Python接口一般有两种方式,get和post1.get方式调用Python接口(1)给定具体的参数,进行一次调用import jsonimport requestsr = requests.get("http://47.92.225.212:8001/OutCall/recognition?nodeId=6212aea7&query=嗯方便的你说&flowId=...

2020-06-29 11:53:35 98

原创 自动提取摘要

目录1.TF-IDF提取关键词2.摘要提取2.1 基于关键词匹配的摘要提取2.2基于关键词评分的摘要提取1.TF-IDF提取关键词TF-IDF是Term Frequency - Inverse Document Frequency的缩写,即“词频-逆文本频率”。它由两部分组成,TF和IDF。TF为词频,即某个词在文章中出现的次数。IDF为逆文档频率:TF-IDF的计算为:TF...

2020-06-29 11:52:53 107 1

原创 openpyxl写入读取数据

1.openpyxl写入数据例子1:import openpyxlf = openpyxl.Workbook()table = f.activetable['A2'] = 4table['A1'] = 5table.cell(row = 3,column = 1,value = 10)table.cell(row = 4,column = 1, value = 11)# 添...

2019-12-02 17:05:34 176

原创 SQL连接查询

1.SQL入门推荐廖雪峰SQL教程https://www.liaoxuefeng.com/wiki/1177760294764384/11796108887964482.SQ连接查询表rules表cates待解决问题:查询表rules中cate_id 对应的path,path_c,pid等信息,这些信息在表cates中,所有要用到连接查询。由两个表可知表rules中cate_id,与...

2019-07-19 10:56:34 143

原创 python 全局变量global

1.使用实例x = 10def foo(): x+=1 print(x)foo()报错,x在应用之前未声明在函数内部添加global x,声明x为全局变量x = 10def foo(): global x x+=1 print(x)foo()正常输出结果:11...

2019-07-19 10:56:10 96

原创 TortoiseGit使用教程

https://blog.51cto.com/blackstorm/1604113https://www.jianshu.com/p/44dc68dba8fahttps://yq.aliyun.com/articles/357080Git懒人教程 http://www.chengfeilong.com/tips-for-Git-users

2019-07-19 10:55:54 8965

原创 mysql连接不上

这两天遇到一个问题,自己做的程序模块,之前运行的好好的,突然报错,运行不了了。pymysql.err.OperationalError: (2003, "Can't connect to MySQL server on '127.0.0.1' ([Errno -8] Servname not supported for ai_socktype)")上面是返回来的错误最开始以为是mysql的...

2019-07-19 10:55:33 220

原创 python 去除特殊符号

1.replace()text = "我的车牌号是粤B-34567。"text = text.replace("-","")text = text.replace("。","")print(text)输出:我的车牌号是粤B345672.split()text = "我的车牌号是粤B-34567。"text = ''.join(text.split('-'))text = ''....

2019-07-19 10:55:08 661

原创 python try...except...总结

1.参考文献https://docs.python.org/zh-cn/3/tutorial/errors.html#exceptionshttps://www.liaoxuefeng.com/wiki/1016959663602400/1017598873256736《python编程从入门到实践》10.3异常2.try…except…应用场景编写得很好且经过详尽测试的代码不容易出现内...

2019-07-19 10:54:08 394

原创 python 日志

1.日志重复打印import logginglogger = logging.getLogger('simple_example')logger.setLevel(logging.DEBUG)ch = logging.StreamHandler()ch = logging.handlers.RotatingFileHandler('date_extract.log.', maxBytes...

2019-06-26 10:48:06 112

原创 python tonador get/post 方法实现以及使用Postman测试接口

1.python tonador服务https://www.tornadoweb.org/en/stable/guide/structure.htmlhttps://www.tornadoweb.org/en/stable/web.htmlhttps://stackoverflow.com/questions/4476373/simple-url-get-post-function-in-p...

2019-06-25 15:26:43 209

原创 Python JSON编解码

1.JSON 函数JSON(JavaScript Object Notation)是一种轻量级的数据格式。使用JSON函数需要导入json库:import jsonjson.dumps 将Python 对象编码成JSON字符串json.loads 将已编码的JSON字符串解码为Python对象实例1import jsona = [1,"a","b"]print("a:",a)...

2019-06-25 11:30:52 999

原创 文本分类算法TextCNN,TextRNN

1.TextCNN1.1相关代码下载https://github.com/dennybritz/cnn-text-classification-tfhttps://github.com/gaussic/text-classification-cnn-rnn1.2 讲解https://hunto.github.io/nlp/2018/03/29/TextCNN文本分类详解.htmlhtt...

2019-05-31 14:35:31 1194

原创 深度学习入门实战

1.DNN1.1.DNN结构和数据说明1.2 DNN代码实现# -*- coding: utf-8 -*-"""Created on Tue May 28 19:22:44 2019@author: lcl"""from __future__ import print_function# Import MNIST datafrom tensorflow.example...

2019-05-30 17:45:54 106

原创 python matplotlib.pyplot 画图

1.matplotlib.pyplot柱状图import matplotlib.pyplot as plt labels_count = [41,32,28,22,22,21,21,21,20,19]labels_name = ["上海理赔管理小组","上海嘉定区外冈五金城营业部","上海浦东保税区营业部","上海闵行区银都路营业部",\ "上海徐汇区凯旋路营业...

2019-05-16 14:24:44 219

原创 python 封装API接口

1.对一天中通话,按时段进行分析输入数据为.txt文件,数据部分展示如下:u110107_02169228380_530005_20190228125930_61AA.mp3u110107_18895672550_530005_20190228165337_FFFFE06F.mp3u110107_18895672550_530005_20190228165433_FFFFE0DC.mp3...

2019-04-04 16:21:06 5228 2

原创 python str与json类型转换

1.str 转jsonimport jsontext = '{"sentences":[{"silence_duration":7,"end_time":19585,"speech_rate":71,"begin_time":18740,\ "text":"喂","channel_id":1,"emotion_value":6.0},{"silence_duration":0,...

2019-03-28 11:53:12 1573

原创 将一个大文件夹拆分为多个小文件夹

任务:要将一个文件夹下的14694条音频文件转换为文本(python调用接口)因为一次运行的次数较多时,服务不稳,会报错想到将所有的音频文件拆分为小文件夹,每个文件夹里包含3000条音频,总共有5个文件夹。import osimport shutil def mkdir(path): folder = os.path.exists(path) if not folder: ...

2019-03-26 19:39:28 3284

原创 TensorFlow 运行TextCNN报错

最近在看TextCNN,运行代码时报错,如下:Variable cluster_weights already exists, disallowed. Did you mean to set reuse=True or reuse=tf.AUTO很奇怪的是这个错误有时候出现,有时候不出现;重启spyder之后就不出现了,运行一次之后又会报错。。。。抓狂。。。。。报错原因:主要是再次执行的时候...

2019-03-11 18:47:25 96

原创 spyder pip 安装tensorflow报错

1.在spyder中安装tensorflow之后,运行报错2.出错原因:pip 安装的tensorflow版本是1.13.1原有的numpy版本是1.14.0出错原有可能是tensorflow与numpy版本不兼容导致的3.修改方法numpy版本升级为最新版升级后的numpy版本为1.16.2具体操作可参考:https://www.twblogs.net/a...

2019-03-05 19:42:10 240

原创 批量读取文件夹下文件

1.批量读取文件夹下的.txt文件file_name = "G:/ASR/chunlan/1/"dirs = os.listdir(file_name)for dir in dirs: if dir.split('.')[-1] == 'txt': path = file_name + dir print(path) else: ...

2019-03-05 19:27:14 310

原创 基于sklearn tfidf提取特征

https://blog.csdn.net/u010967382/article/details/79728404https://zhangzirui.github.io/posts/Document-14%20(sklearn-feature).md在用CountVectorizer()计算文本特征时,发现单个的词会被过滤掉,发现在CountVectorizer()中设置参数analyz...

2019-02-25 19:36:49 419

原创 SVM算法中各标签对应精确率,召回率,f1score

1.精确率,召回率,f1score主要参考博文https://www.cnblogs.com/pinard/p/5993450.html2.用sklearn计算各标签对应的精确率,召回率,f1score,support(测试样本个数)https://scikit-learn.org/stable/modules/classes.html#module-sklearn.metricscl...

2019-02-21 09:25:40 4121 1

原创 数据库操作

1.mysql下载与安装https://blog.csdn.net/zhouzezhou/article/details/52446608上篇博文写的很清楚,就不重复写了安装过程中遇到的问题:打开cmd,输入“mysql -u root -p”回车,返回'no modual mysql'原因:环境变量没有配置好解决方案:配置环境变量时”用户变量”和”系统变量”下的path都添加...

2019-02-19 18:41:31 104

原创 数据库操作

1.数据库基本操作http://www.runoob.com/python/python-mysql.htmlhttp://www.runoob.com/python3/python3-mysql.htmlhttps://www.ctolib.com/TracyMcgrady6-pymsql_Operation.html2.数据批量导入数据库https://blog.csdn....

2019-02-18 20:41:59 52

原创 机器学习

(1)朴素贝叶斯《机器学习实战》第四章https://blog.csdn.net/hjimce/article/details/46054739《机器学习》周志华第七章(2)逻辑回归线性回归  https://blog.csdn.net/hjimce/article/details/45418645                http://www.cnblogs.com...

2018-07-20 21:52:40 126

原创 Voicebox

Voicebox官网http://www.ee.ic.ac.uk/hp/staff/dmb/voicebox/voicebox.html Voicebox下载http://www.ee.ic.ac.uk/hp/staff/dmb/voicebox/voicebox.zipmatlab中voicebox工具箱的添加http://blog.csdn.net/cwfjimogudan/article/d...

2018-07-13 17:59:50 1462

原创 音频信号降采样

最近开始做鼾声算法,涉及到音频处理这一块。做算法首先要搜集数据,鼾声的录制是直接使用手机的录音功能,整晚录制的音频数据一般为6~8个小时,手机录音采样频率为48000Hz或者44100Hz,数据庞大,matlab无法整段读入,为了减小数据量以及方便之后对鼾声信号的处理,需要先对搜集的音频信号进行降采样处理。算法中需要将采样率减小到16000Hz。1)使用FFmpeg,FFmpeg的下载与使用见附件...

2018-07-13 17:06:40 3911

原创 机器学习算法与Matlab实践:k-近邻(kNN)

理论部分与“机器学习算法与python实践:k近邻(kNN)”这篇博文相同,实践数据也相同,差别为代码部分为作者用Matlab重新编写。 最近开始学习机器学习,理论部分主要参考周志华老师的《机器学习》这本书,实践部分主要参考《机器学习实战》这本书,另外还参考了一些博客。1.k近邻算法分析  k近邻(k-Nearest Neighbors,kNN)学习是一种常用的监督学习方法,其工作机制非常简单:给...

2018-07-10 17:03:21 2458

原创 JavaScript 计时事件

(1)    setTimeout() 未来的某时执行代码var t=setTimeout(“javascipt语句”,毫秒)//第二个参数指示从当前起多少毫秒后执行第一个参数。(2)    clearTimeout()  取消settTimeout()示例:test       var c=0;var t;varele=

2016-04-10 09:00:11 131

提示
确定要删除当前文章?
取消 删除