自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(66)
  • 收藏
  • 关注

原创 机器学习—SVD

文章目录SVDSVD与PCA本文将记录学习刘建平大佬SVD博客的相关内容。SVD在特征值和特征向量分解中,一个N*N的矩阵A可以分解为A=WΣW−1A=W\Sigma W^{-1}A=WΣW−1,其中W矩阵是A矩阵的特征向量组成的标准正交列向量矩阵,Σ\SigmaΣ矩阵是由A矩阵的特征值组成的对角矩阵,由于W矩阵是列向量的标准正交基,则W−1=WTW_{-1}=W^TW−1​=WT由于特征...

2018-11-17 16:20:46 233

原创 机器学习—PCA

文章目录PCA本文将记录有关PCA降维的内容。当样本维度过高但是数据集数量较小时,在训练模型时很容易陷入过拟合,处理过拟合可以采用正则化、增加数据量、降低数据维度。在降低数据维度可以采用的方法有特征选择、线性降维(PCA)、非线性降维(流形)PCA数据集X=(x1,x2,..,xN)TX=(111)X=(x_1,x_2,..,x_N)^T\\X=\left( \begin{array...

2018-11-16 22:51:45 443

原创 机器学习—GBDT

文章目录本文记录《统计学习方法》和刘建平大佬的有关GBDT梯度提升树的内容。

2018-11-12 13:56:58 282

原创 机器学习—提升算法

文章目录Adaboost分类算法Adaboost回归算法前向分布算法本文将记录《统计学习方法》中有关提升学习Adaboost的内容。Boosting算法的工作机制是首先从训练集用初始权重训练出一个弱学习器1,根据弱学习的学习误差率表现来更新训练样本的权重,使得之前弱学习器1学习误差率高的训练样本点的权重变高,使得这些误差率高的点在后面的弱学习器2中得到更多的重视。然后基于调整权重后的训练集来训...

2018-11-08 17:09:22 908

原创 机器学习—SVM

文章目录SVM几何间隔和函数间隔间隔最大化硬间隔的对偶形式软间隔最大化本文将记录《统计学习方法》中有关支持向量机的内容。SVM考虑一个二分类问题,在输入空间中数据是线性可分的,那么存在一个超平面wx+b=0,可以将该空间一分为2,将数据分类开,它有法向量w,和截距b决定,规定法向量指向的为正类,另一侧为负类。对于给定的线性可分的数据集,存在无数个超平面可以将数据集分离开,采用间隔最大化的误...

2018-11-06 22:25:05 354

原创 机器学习—逻辑回归

本文将记录《统计学习方法》中有关逻辑回归的内容文章目录线性回归对数线性回归对数几率回归线性回归对于给定的数据集D={x1,y1...xN,yN}D=\{x_1,y_1...x_N,y_N\}D={x1​,y1​...xN​,yN​},其中xi=(xi1,xi2,...,xid)  ;y∈Rx_i=(x_{i1},x_{i2},...,x_{id})\;;y \in...

2018-11-01 13:24:27 448

原创 机器学习—决策树

文章目录算法流程ID3&C4.5信息增益信息增益率CART基尼指数本文将记录在《统计学习方法》中有关决策树的内容算法流程ID3&C4.5信息增益熵表示随机变量的不确定性的程度。X是有有限制的离散随机变量集X={x1,x2,...,xN}X=\{ x_1,x_2,...,x_N\}X={x1​,x2​,...,xN​},则该数据集的熵为:H(X)=−∑i=1

2018-10-29 22:53:21 577

转载 机器学习—python手动实现KD树算法

# --*-- coding:utf-8 --*--import numpy as npclass Node: # 结点 def __init__(self, data, lchild=None, rchild=None): self.data = data self.lchild = lchild self.rchild = rchildclass KdTree: ...

2018-10-25 23:16:00 472

原创 机器学习—python+sklearn实现KNN&KD树算法

python+sklearn实现KNN及KD树算法from sklearn import datasets# 导入内置数据集模块from sklearn.neighbors import KNeighborsClassifier# 导入sklearn.neighbors模块中KNN类import numpy as npfrom sklearn.neighbors import KDTree...

2018-10-25 22:23:46 4395

原创 人工智能自动组方实习笔记—基于欧式距离方剂推荐

文章目录根据病症相似性进行匹配推荐药方数据预处理推荐药方根据病症相似性进行匹配推荐药方数据预处理对于有证型标签的279条带下病的数据进行人工标注实体分为病名、病症、证型、治疗方法四个类别,其列表长度分别为37、1082、62、183对于1082维的病症类别,通过与中医字典进行对比,计算L式编辑距离与人工操作,将病症化简为471种病症,得到有关带下病病症字典,其中默认每种病症的第一个描述方...

2018-10-25 19:19:42 809 3

原创 机器学习—感知机

本文记录了在机器学习中有关感知机的内容,如果有那位小伙伴在做类似的工作,可以和我邮件交流(1318525510@qq.com)#感知机感知机是二分类的线性分类模型,得到一个输入空间中划分为正负两类的超平面:f(x)=sign(wx+b)f(x)= sign(wx+b)f(x)=sign(wx+b)对于输入空间中的数据集{(x1,y1),...,(xn,yn)}\{(x_1,y_1),...,...

2018-10-25 19:13:56 205

原创 人工智能自动组方实习笔记8—多字典的最大正向匹配算法及python实现

本文章记录了在人工智能自动租房实习中使用的最大正向匹配算法及python代码实现,如果有哪些小伙伴最近也在做相关工作,可以发邮件与我联系(1318525510@qq.com)互相交流学习。...

2018-08-30 18:01:22 851 1

原创 python遇到的问题总结

1 dataframe 对于某一列去重f = f.drop_duplicates(subset='名称')2 csv文件名中有中文f = open('中文.csv','r',encoding='utf-8')f= pd.read_csv(f)3 两个dataframe合并dataframe1.append(dataframe2)#两个dataframe样式完全一样...

2018-08-20 16:31:29 376

原创 人工智能自动组方实习笔记7—中医数据预处理中使用过的python代码

本文记录了在中医自动组方实习中对于中医数据预处理过程中使用过的python代码,代码没有什么深度只是日常操作,在此做个记录以便将来如果有问题再进行查找,如果有那位小伙伴在做类似的工作,请在博文下留言或者发邮件和我联系(1318525510@qq.com)...

2018-08-16 21:25:28 1615

原创 人工智能自动组方实习笔记6—机器学习分类算法及python+SKlearn实现

本文记录了在

2018-08-14 16:58:27 1195

原创 人工智能自动组方实习笔记5—中医数据预处理流程

本文将记录在人工智能智能组方实习中有关数据预处理及使用机器学习分类算法的总结,有如果有哪位小伙伴在做相关内容,可以发邮件联系(1318525510@qq.com)与我互相学习互撩互喷数据预处理在该推荐模块使用的数据集是前期279条带下病药方数据集,该数据集包含了方名、规范名、经典、出处、主治、大类类型、证型、功用、功用大类、功用小类、处方、炮制、方解、禁忌、化裁、附方、文献、用法用量、名家...

2018-07-10 17:32:29 2219 1

原创 人工智能自动组方实习笔记4—网络爬虫相关python库及python代码实现

本文将记录在人工智能自动组方实习中前期有关于网络爬虫的内容,有如果有哪位小伙伴在做相关内容,可以发邮件联系(1318525510@qq.com)与我互相学习互撩互喷在前期准备工作中,需要得到中医相关的大量数据包括中医药材,药方,疾病,及疾病处理等多个数据集。对于疾病数据库将某本中医书籍上的疾病信息通过人工处理和OCR加工,对于中医药材药方数据集采用网络爬虫从中医相关网站爬取,对于疾病处理数据库...

2018-07-09 17:10:09 1242 1

原创 人工智能自动组方实习笔记3—FCM模糊C聚类算法

本文记录的是在人工智能自动组方实习中前期学习过的一篇论文中提到的一种聚类算法及改进版本的NFAFCM算法(FA算法详见萤火虫算法),虽然最后没有使用这个算法,但我个人认为这种以簇为中心存在隶属度模糊分类方法在文本处理中有很多的应用场景,则将其整理记录下来。有如果有哪位小伙伴在做相关内容,可以发邮件联系(1318525510@qq.com)与我互相学习互撩互喷FCM模糊C聚类算法目标...

2018-07-06 15:50:11 831

原创 人工智能自动组方实习笔记2—萤火虫算法

萤火虫算法萤火虫算法是一种新颖的进化算法,是根据自然界中萤火虫的发光行为所构造出的基于群体搜索的智能优化算法。该算法的基本思想是利用在一定范围内萤火虫发光低的向发光高的萤火虫移动,从而有效的实现寻找最优解。 由于萤火虫算法原理相对简单、且易于实现;而且还具有良好的全局寻优能力,能够快速地收敛于最优解等特性,现在萤火虫算法已经应用到工业优化、动态路径规划、图像处理、经济调度等领域。 在萤火虫...

2018-07-06 14:06:20 4734

原创 机器学习-朴素贝叶斯原理

朴素贝叶斯朴素贝叶斯假设朴素贝叶斯原理算法过程算法小结朴素贝叶斯我们的分类模型中有M个样本,每个样本有N维,输出的类别有C类。 样本例如(X11,X12,X13...X1n,Y1)(X11,X21,X31...Xn1,Y1)(X_1^1,X_2^1,X_3^1...X_n^1,Y_1)(X21,X,2X23...X2n,Y2)(X12,X2,X32...Xn2...

2018-07-05 15:18:15 452

原创 人工智能自动组方实习笔记1—工作记录

本系列文章将记录在某中医人工智能公司实习期间所作的工作内容 自动组方本次实习在某中医人工智能公司实现对于中医妇科病的自动组方功能。在中医妇科中奖疾病分为几个大的类别如月经病、带下病等,月经病下又有月经不调、痛经等疾病,每个疾病下又分为类似于气血两虚、肾阳虚等病机,在每个病机下有具体的病症,每个病机对应着治疗该病机的药方。具体结构如下图: 则自动组方的方法是通过对输入的病症集通过...

2018-07-05 15:15:03 1042

原创 机器学习- ML-KNN算法实现多标签问题的聚类

https://www.zybuluo.com/1318525510/note/1160159

2018-05-30 17:42:41 3421

原创 机器学习-K_means算法python实现

利用python进行K_means算法 # -*- coding: UTF-8 -*-import numpyimport randomimport codecsimport reimport matplotlib.pyplot as pltdef calcuDistance(vec1, vec2): # 计算向量vec1和向量vec2之间的欧氏距离 re...

2017-12-25 19:47:06 374

原创 CV-提取图像Freeman码python实现

在anaconda和python下提取图像的freeman码先利用opencv中的cv2.findContours 函数描述图片的轮廓,然后再返回值中得到一个有关于图像轮廓的数组,因为我们要的是freeman码,根据网上对于freeman.码 的定义,对于得到的数组进行相对于的操作即可得到对应的Freeman以下是在anaconda下的python的代码 '''提取一个图像的F...

2017-11-24 18:00:22 3886 4

原创 CV-FFT算法总结

BJUT数字与图像处理作业在下载了anaconda(python3.6)的版本下,在anaconda的库包里包含了需要的所有函数,并不需要添加opencv库,但添加上也可以,因为很多网上的代码都是在opencv的库函数的支持下进行操作的,在此出现的问题有:如何添加open CV在网址点击打开链接中有具体的opencv 的使用方法,可以借鉴,但是我使用的是点击打开链接中所推荐的方法,只需

2017-11-20 20:20:02 1315

原创 CV-图像进行FFT算法及逆算法python实现 BJUT数学与图像处理作业

在Anaconda +python下进行FFT算法实习及其逆算法,BJUT数字与图像处理作业一1) 将宽为2n的正方形图像,用FFT算法从空域变换到频域,并用频域图像的模来进行显示。2) 使图像能量中心,对应到几何中心,并用频域图像的模来进行显示。3)将频域图象,通过FFT逆变换到空域,并显示。 #FFT.pyimport numpy as npfrom skimage i...

2017-11-20 20:08:31 1438

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除