机器学习
MasonYyp
这个作者很懒,什么都没留下…
展开
-
Python安装PaddleOCR
Python安装PaddleOCR原创 2022-10-10 18:58:41 · 2196 阅读 · 0 评论 -
fastText文本分类
facebook参考地址fastText安装包使用tar文件安装比较麻烦,建议使用whl安装开发文档2 源文件3 数据格式训练样本测试样本原创 2022-06-29 19:34:55 · 457 阅读 · 0 评论 -
基于python使用CV裁剪图片
1 基本需求使用CV使用将一张长图片裁剪成高度相同宽度不变的多张图片。例如:"1.png" 转化为“1-1.png"、“1-2.png"、“1-3.png"、……裁剪图片有两种方法,一种使用CV(推荐),另一种使用Pillow,我使用Pillow总是提示各种错误(可能是我没有弄懂他的开发文档)2 截图3 代码cut_item_img_cv(file_name, in_img_path, out_dir): img = cv2.imread(in_img_path)...原创 2021-09-17 07:33:36 · 1836 阅读 · 0 评论 -
Python安装PaddleOCR
注意:我的系统是Ubuntu18.41 安装Paddlegithub打不开,可以使用这个网站加速:GitHub: Where the world builds software · GitHubPaddlerOCR官网开发文档GitHub: Where the world builds software · GitHub# 安装paddlepaddlepython3 -m pip install paddlepaddle -i https://mirror.baidu.com/p原创 2021-09-16 15:56:02 · 1758 阅读 · 1 评论 -
安装和使用nltk
1 安装nltkpip install nltk2 离线安装数据集在下载受到网络和网速的限制,无法在线安装。(1)下载nltk_data包github下载地址:https://github.com/nltk/nltk_data/tree/gh-pages解压后,将nltk_data中的package重命名为nltk_data,nltk_data数据组成文件如下:chunkers grammars misc sentiment taggers corpora help model原创 2021-05-17 17:42:57 · 2592 阅读 · 2 评论 -
Gensim中Doc2Vec方法简介
Doc2Vec主要作用是将文章转化为词向量,支持大批量的数据训练,如果遇到多个较大的数据文件,不能全部加装到内存中,可以使用下面的方法,自己封装TaggedDocument。如果数据量较小,且只有1个数据文件,可以使用doc2vec.TaggedLineDocument,注意,数据文件一行对应一篇文章,并且词必须以空格隔开。1 TaggedLineDocument训练小数据 # 设置迭代器 tagged_line = TaggedLineDocument("F:\\my_data\\t...原创 2020-09-03 10:51:56 · 3013 阅读 · 0 评论 -
python生成whl包
1 在工程目录下建立setup.py官方文档,请参见 https://setuptools.readthedocs.io/en/latest/setuptools.htmlfrom setuptools import find_packages, setupsetup( name='jieba_test', version='1.0.0', author="Mason", description="jieba test", packages=find_p...原创 2020-08-24 14:02:10 · 3342 阅读 · 0 评论 -
Anaconda常用命令
# 查看conda的版本coda -V || conda --version1 conda常用命令1.1 查看包# 查看所有已安装的包conda list# 查看已安装的包numpyconda list numpy# 查找未安装的包numpyconda search numpy1.2 管理包# 安装包conda install numpy# 安装指定环境下的包conda remove --name 环境名 包名conda install --name tf_py..原创 2020-05-11 20:17:05 · 728 阅读 · 0 评论 -
RNN和LSTM的理解
原创 2020-04-19 18:14:54 · 178 阅读 · 1 评论 -
矩估计和极大似然估计的理解
原创 2020-04-17 19:52:38 · 2611 阅读 · 0 评论 -
python中线性规划问题
1、python中的scipy中提供了线性规划模块1)模块导入from scipy import optimizeoptimize.linprog2)模块特点说明需要注意的是这个模块只能找到线性规划的最小值,因此,如果约束条件的不等式(变量除外)中含有“大于等于”的需要修改为“小于等于”,例如:x+y>=5,转换为-x-y<=-5;最大化max_z=x+y,转换为最小化m...原创 2018-08-23 11:17:53 · 3231 阅读 · 1 评论 -
pickle使用方法
1、多次存储和提取import pickleclass Cat: ''' The object of cat ''' head = "head" body = "body" foot = "foot" # initial the cat def __init__(self, head='0', body='1', foo...原创 2018-09-04 18:02:22 · 486 阅读 · 0 评论 -
pandas基本使用方法和表的合并
import pandas as pddef basic_pd(): # pandas get data of excel path = "D:/test/test.csv" # Reading csv is similar to reading excel df = pd.DataFrame(pd.read_csv(path, header=0)) ...原创 2018-09-07 17:38:38 · 2141 阅读 · 0 评论 -
SublimeText3自动补全python提示
1、SublimeText3下载地址https://www.sublimetext.com/32、安装SublimeText33、安装SublimeCodeIntel(1)打开SublimeText3;(2)按快捷键“ctrl+p”,或者“Preferences->Package control”输入“Package Control: InstallPackage”;(3)输入“...原创 2018-09-21 15:43:47 · 10292 阅读 · 0 评论 -
Python读取MIT-BIH数据中心电信号
1、MIT-BIH心律异常数据库MIT-BIH心律异常数据库是公认标准的心电图数据库,wfdb包可以解析出心电图数据,本文使用Python对心电数据进行了解析,并写出了自己的理解,请批评指正。也可以从github上下载作者写的工程github地址:https://github.com/MasonYyp/wfdb_ecg,2、部分源代码# 说明:不同版本的wfdb包,读取心电信号的方法可...原创 2018-11-04 19:25:15 · 8577 阅读 · 1 评论 -
sklearn中提取模型的权重和分割测试集与训练集
1、获得权重1)查看模型训练数据集的特征权重,利于分析模型对特征的偏好、调整模型参数、分析数据很重要。2)例子如下:import xgboost as xgbdef load_model(X_train, X_test, y_train, y_test): params = { 'booster': 'gbtree', 'objective': 'm...原创 2018-08-21 19:35:40 · 3558 阅读 · 0 评论 -
Python中numpy矩阵合并和初始化
1、numpy中两个矩阵的合并1)理论np.r_[up, down],把两矩阵上下相加,按列连接两个矩阵,要求列数相等。np.c_[left, right],把两矩阵左右相加,按行连接两个矩阵,要求行数相等。2)例子: import numpy as np # up和down都是二维矩阵 up = np.array([[1, 2, 3], [4, 5, 6], [...原创 2018-08-22 19:52:36 · 3006 阅读 · 0 评论 -
AdaBoost算法的理解
原创 2020-04-16 16:01:03 · 141 阅读 · 1 评论 -
数据降维的理解
原创 2020-04-06 18:21:28 · 1997 阅读 · 0 评论 -
线性回归和逻辑蒂斯回归的理解
原创 2020-04-02 16:10:55 · 191 阅读 · 0 评论 -
误差反向传播算法理解
原创 2020-03-28 22:00:03 · 958 阅读 · 1 评论 -
隐马尔可夫的理解
原创 2020-03-23 18:54:32 · 127 阅读 · 0 评论 -
常用经典不等式
原创 2020-03-20 23:17:36 · 1620 阅读 · 0 评论 -
期望极大算法的理解(EM)
原创 2020-03-20 14:26:52 · 165 阅读 · 0 评论 -
模型分类
机器学习算法分类1、树模型决策树(Decision Tree)、GDBT、XGboost、RF(Random Forest、随机森林)、2、聚类模型3、网络模型感知机学习算法(PLA: Perceptron Learning Algorithm)、多层感知机(MLP:Multi-Layer Perception)、CNN、RNN4、概率模型马尔可夫模型、贝叶斯模型...原创 2020-03-12 00:01:09 · 1368 阅读 · 0 评论 -
模型参数调整
1、过拟合解决方法降低模型复杂度-调整卷积深度,全连接层参数个数2、样本不平衡表现为模型对数据量较多的识别性能较高,并且可能出现全部识别为样本数多的哪一类3、二维卷积转化为一维卷积二维卷积识别样本的准确率不高,并且模型准确率没有显著变化,即二维卷积把所有的样本全部识别为某一类4、调整学习率学习率较大时,梯度波动较大,表现为分类的准确率波动较大,学习率调大,可能出现loss消失,...原创 2020-03-11 23:59:39 · 1182 阅读 · 0 评论 -
多元线性回归拟合公式
原创 2018-10-31 21:43:07 · 8452 阅读 · 1 评论 -
贝叶斯分类器的理解
原创 2020-03-11 23:48:01 · 244 阅读 · 0 评论 -
决策树的理解
原创 2020-03-08 12:48:49 · 374 阅读 · 0 评论 -
范数和距离的理解
原创 2019-04-26 22:13:45 · 396 阅读 · 1 评论 -
SVM数学基础推导
原创 2019-04-26 22:11:12 · 166 阅读 · 0 评论