![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python
文章平均质量分 79
XINFINFZ
24岁。毕业于武汉大学心理学本科。
展开
-
python十行代码批量下载百度翻译语音
相信有很多人在使用百度翻译的时候会感到这样的疑惑,我该怎样把单词的注音下载下来,那么今天我就教大家如何从下载单个语音到批量下载语音。原创 2023-03-30 10:44:46 · 751 阅读 · 0 评论 -
windows安装PaddleSpeech(无需visual studio)
在python3.9的windows环境下免编译安装PaddleSpeech,no more visual studio!!!!原创 2023-02-10 10:14:55 · 1265 阅读 · 2 评论 -
python的simswap库配置详细教程
简介本文是开源库SimSwap的配置教程,与另外两个耳熟的换脸库faceswap和deepfacelab相比,它的要求更低(只要一张图片),用法更加简洁,但官方教程却写得不够仔细,本文将以图文方式来介绍使用cuda和onnxruntime-gpu来进行视频换脸的具体配置。注:这个库上使用cuda请确保你有3G以上的显存。环境配置第一步配置conda假定你已经安装了cuda,没安装的查阅另外的教程。本例中cuda版本为11.4,onnxruntime-gpu也为最新的1.10.0。查阅cuda原创 2022-04-26 11:41:21 · 3017 阅读 · 9 评论 -
python调开源库实现四行代码极简OCR示例
简介相信不少人都被上周的新闻《复旦博士用130行代码核查核酸报告,800份只需要2分钟》洗眼睛了,哪里的新闻媒体都在报道,好像是什么了不得的大事一样,评论区也有“你怎么不做一个,你上啊”的暴论,本文就给某些键盘侠开开眼界,现在的OCR简单到了什么程度。无脑吹和学历崇拜请自行退出,谁没上过985大学啊,博士生,无非就是科研领域能发一些导师指导的论文罢了,自身有多大造福社会的水平,不需要我说,某些搞科研拿经费的比我更清楚。需识别图片没有拿到详细的纸质核酸报告,就拿张截图示意一下。代码import e原创 2022-04-18 10:54:15 · 952 阅读 · 0 评论 -
Pyts入门之时间序列的分类---SAX-VSM算法详解(三)
简介相信不少人会被这个标题唬住,什么叫SAX-VSM算法,其实并不难,容我细细道来。首先它来自2013年的"SAX-VSM: Interpretable Time Series Classification Using SAX and Vector Space Model"这篇论文,全称为Symbolic Aggregate approXimation in Vector Space Model(在向量空间模型中进行符号聚合近似),其实就是先进行符号聚合近似(SAX),再进行词向量的转换(VSM),细心原创 2022-03-02 15:56:59 · 1786 阅读 · 0 评论 -
Pyts入门之时间序列的分类---K近邻算法及调参小技巧(二)
简介书接上文(2021.11.05),在介绍了pyts的时间序列简单特征提取之后,我们来介绍一下对时间序列的分类算法,从KNN(k-nearest neighbors)算法开始,一篇文章介绍一个分类算法。因为工作上的一些烦心事情,最近一直都没写文章,可能关注我的小伙伴都忘了为啥关注我,实在抱歉,那么我们进入正题,首先需要先对KNN算法(分类)有个大概的了解:1.它不是K-means算法(K-means是无监督的聚类算法,新手经常会把它们搞混)。2.它是监督学习(supervised learning)原创 2022-02-28 13:48:24 · 1636 阅读 · 0 评论 -
修改onnx模型输出示例
前言如图是netron(github链接)软件中打开的onnx模型,可以看到右边模型的最终输出结果是分类值predict_0而非概率值,那么如何获取中间过程的概率值,或者说怎么把右边的图砍掉一截变成左边的图呢?代码读入模型import onnxonnx_model = onnx.load("xxx.onnx")graph = onnx_model.graph首先以图的形式读入你的模型,图一般包括node(节点),initializer(初始化),input(输入),output(输出)四部原创 2022-01-14 09:35:36 · 6176 阅读 · 3 评论 -
部署机器学习模型原理及实践(bentoml)
相信大家对自己训练好的模型如何进入生产都有疑惑,这篇文章以bentoml为例详细说明了如何正确部署一个机器学习的生产模型.原创 2022-01-10 16:15:49 · 2354 阅读 · 3 评论 -
玩转jpmml之tpot+sklearn2pmml自动化机器学习集成模型部署
前言应该是首发原创,网上没搜到。总体的逻辑是:数据导入----tpot自动化机器学习挑选最适合的模型和数据预处理思路----转换为sklearn代码----通过sklearn2pmml库转换为pmml模型----通过jpmml库调用pmml模型实现在java中部署。好像看起来很简单,但是实际处理中问题不少,且在外网上甚至搜不到相关答案,可以说完全自己摸索出来的路径,在这里给后来人借鉴宝贵经验。注:本章中的模型为stacking三层模型,因此和一般的机器学习模型转换存在相当大的差异。实验sklea原创 2021-12-30 11:00:04 · 931 阅读 · 0 评论 -
【sklearn】详解classification_report的分类报告计算
简介说来惭愧,好久不写博客,让我动笔的竟然是sklearn一个小小的api功能,以前评价模型用的都是总体的准确率,第一次用sklearn提供的分类报告功能竟然搞不懂是怎么计算的,怎么还分类别。就像下面这样:嗯,这都啥呀?老实说第一次看我只看懂了准确率即accuracy是怎么计算的。。。计算首先results是我们模型预测出的结果,y是真实标签,它们分别如下:yarray([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0原创 2021-12-21 16:27:59 · 15973 阅读 · 10 评论 -
使用win10+RTX4000从零搭建pytorch+CUDA+cudnn的经验之谈
前言最近有本地部署深度学习模型的需求,故采购了新电脑,以往都是在云端已经搭建好的环境下操作,还从来没有本地从零搭建,所以来总结一下昨天搭建时碰到的障碍和一些经验分享。注:本文不提供具体教程,因为写同类文章的太多了,需要可以点击这里。另,本文预装torch版本为1.9,明面上支持的cuda版本为10.2,但实际上最新的CUDA11.5也一样能用,所以啥都装最新的就完事了。别信啥特定版本匹配兼容什么的,问就装最新。拿到新电脑,我该做什么?我的第一步:找到英伟达控制面板和体验中心(安装最新显卡驱动)一般来原创 2021-11-30 11:53:40 · 5983 阅读 · 0 评论 -
pyts入门之时间序列的简单特征提取(一)
简介pyts简单的说就是打包了多种时间序列分类和处理算法的类scikit-learn库,国内介绍该库的文档相对较少,所以本人打算开一个新坑,在学习的同时结合自身的理解介绍pyts库的主要api和功能。那么在进入正题前先介绍一下pyts的基本概念,定义时间序列(x1,x2,x3…,xn),如果一个时间序列只有一个特征,那么xi属于实数集R,该时间序列为单变量时间序列,如果一个时间序列有多个特征,那么xi属于R^d,d指维度,xi为一个d维向量,该时间序列为多元时间序列(比如一串GPS就有纬度和经度两个坐标原创 2021-11-05 14:32:31 · 7689 阅读 · 4 评论 -
python使用numpy库将一个list中多段文本生成字典并统计词频
目的将形如 L = [‘I have an apple …’,‘I have an egg…’,‘I don’t like pen…’]的列表进行预处理,并使用numpy.unique函数进行统计,生成提供给tf-idf使用的字典。ps:也就是除了基础的科学计算库外不用其他库,造轮子行为。实现先来稍微复杂一点的实现:import numpy as npLA = np.array(['addc cdba ddaa dcaa dcba dcaa dcba dcaa dbaa dbbb cdba db原创 2021-10-26 11:04:56 · 649 阅读 · 0 评论 -
时间序列匹配之dtw的python实现(一)
简介Dynamic Time Warping(动态时间序列扭曲匹配,简称DTW)是时间序列分析的经典算法,用来比较两条时间序列之间的距离,发现最短路径。笔者在github上搜索dtw时发现了两个比较经典的库:dtw和dtw-python。dtw库的功能少但简单容易理解,dtw-python的功能齐全并提供了清晰的作图。在这里我们先介绍dtw库,dtw-python库留到下一篇文章介绍。示例对dtw算法的基本原理还不是很理解的可以点击这里,里面介绍的相当清楚了,接下来我们进入正题。import num原创 2021-10-15 10:32:13 · 13114 阅读 · 12 评论 -
Pillow库学习笔记之Image.convert去底色详解
目的需要提取出图中的数字,但是图中数字受到两种背景色的影响,因此需要先将其去掉。实现方法一(直接对数组操作)首先按照官网示例看看图片的基本信息。from PIL import Imageim = Image.open("xxx.jpg")print(im.format, im.size, im.mode)分别打印出图片的格式,尺寸,颜色模式如下:JPEG (144, 231) RGB图片是RGB模式也就意味着图片包含三个通道的信息,我们实际要处理的是231(高度)x144(宽度)x原创 2021-10-14 15:02:32 · 1182 阅读 · 0 评论 -
用python做带调节的中介模型检验详解
简介在采用传统统计手段的经济学,心理学等学科中,通常是在阅读大量文献的基础上,提出自己的理论假设,并建立模型,收取一定量(通常是几百)的样本数据来验证自己的假设。其中就包含了调节,中介变量这类非常容易发论文的模型。而在学习中我们会发现老师让我们使用SPSS的PROCESS插件来处理这类模型。但是SPSS收费(虽然用的通常是破解版),PROCESS插件安装麻烦,于是我想到了python,今天就来教大家使用python的PyProcessMacro开源库来进行调节中介模型的统计检验。事前准备关于搭建pyt原创 2021-09-06 12:38:11 · 6600 阅读 · 2 评论 -
简单两步解决Python的NLTK库DATA安装问题
前言本人使用Anaconda集成开发环境,已经安装有NLTK库,在使用NLTK最简单的分词功能时报错,查询错误,得知是没有安装NLTK的数据包,系统推荐使用以下命令:import nltknltk.download()用了之后弹出窗口,出现NLTK的下载器,点击下载,报错10060,网络无响应。解决方法第一步:打开 https://github.com/nltk/nltk_data 页面,点击绿色按钮下载整个压缩包解压后将其中的packages文件夹更名为nltk_data。将其整个原创 2021-03-08 17:11:41 · 1195 阅读 · 0 评论 -
python数据工程师养成(1)--小说字频统计
小说字频统计简介数据源目标步骤总结参考书目简介最近看到了一本好书,名字叫《Python全栈数据工程师养成攻略》,随便翻翻感觉对个人学习颇有裨益,故打算跟着书上的实例学完它。本书采用Python2.7和Subline编辑器,不过由于个人做数据科学经常用的是Anaconda里面的几款编辑器,所以本次实例采用Python3.5和Spyder编辑器,并且对原项目的语法上进行了一些修改。本次实例比较基...原创 2019-05-10 11:26:07 · 442 阅读 · 0 评论