AI进击之路
本专栏用于记录自己在AI这条路上的成长,初始记录机器学习相关的,到后面将会涉及到深度学习,NLP......
richard1230
这个作者很懒,什么都没留下…
展开
-
K-means代码实现
文章目录代码实现代码实现from numpy import *#加载数据def loadDataSet(): dataMat = [] fr = open("testSet.txt") for line in fr.readlines(): curLine = line.strip().split('\t') # fltLine ...原创 2019-06-24 19:16:44 · 2438 阅读 · 0 评论 -
adaboost代码实现
文章目录from numpy import *def loadSimpData(): datMat = matrix([[1., 2.1], [2., 1.1], [1.3, 1.], [1., 1.], [2., 1...原创 2019-06-23 18:03:31 · 353 阅读 · 0 评论 -
逻辑回归代码实现
文章目录理论代码理论Logistic回归:用于预测结果是界于0和1之间的概率在Logistic回归中,对数几率是关于X是线性变化的。几率(odds):该事件发生的概率与该事件不发生的概率的比值0-1事件中事件1发生的概率为P,0发生的概率就是1-P;事件1发生的几率:对数几率:根据概率公式:通过对数几率:推导出:根据线性关系:W为回归系数;这个函数对应的...原创 2019-06-19 16:05:13 · 6491 阅读 · 0 评论 -
朴素贝叶斯代码实现
文章目录from numpy import *def loadDataSet(): postingList = [ ['my', 'dog', 'has', 'flea', 'problems', 'help', 'please'], ['maybe', 'not', 'take', 'him', 'to', 'dog', 'park', 'stu...原创 2019-06-05 16:58:36 · 762 阅读 · 1 评论 -
决策树代码实现
文章目录一些基本概念代码以及注释一些基本概念熵(entropy):熵指的是体系的混乱的程度,在不同的学科中也有引申出的更为具体的定义,是各领域十分重要的参量。信息论(information theory)中的熵(香农熵): 是一种信息的度量方式,表示信息的混乱程度,也就是说:信息越有序,信息熵越低。例如:火柴有序放在火柴盒里,熵值很低,相反,熵值很高。信息增益(information ga...原创 2019-05-28 14:39:46 · 1764 阅读 · 0 评论 -
knn代码实现
文章目录原理代码相关测试代码原理knn原理:存在一个样本数据集合(训练集),并且样本集里面每个数据都存在标签;输入没有标签的新数据之后,将新数据的每个特征与样本集里面的数据对应进行比较(计算欧式距离),而后算法提取样本集里面的特征最相似的前k个数据,通过投票的方式来选择标签:代码import numpy as npimport operatordef createDataSet()...原创 2019-05-23 17:17:07 · 1132 阅读 · 0 评论 -
李宏毅老师机器学习__(1)机器学习介绍
文章目录机器学习定义机器学习三板斧监督学习Structuerd Learning无监督学习半监督学习Reinforcement LearningTransfer Learning学习导图机器学习开发流程总结机器学习定义机器学习三板斧1.定义一个函数集合2.找到函数的评价标准;3.选择最佳的函数监督学习用已知某种或者某些特性的样本作为训练集,建立一个数学模型,再用已经建立的模型来预测...原创 2019-04-30 23:45:51 · 1983 阅读 · 0 评论 -
数据处理时axis=0与ax=1时候的区别
文章目录之前在做数据处理的时候对于axis=0的时候和axis=1的时候的情况总是混淆,昨天在同学的帮助下总算有了一些理解,特此记录一下:df1 = pd.DataFrame([[7,‘8’,9],[10,11,‘12’]],columns=list(‘ABC’))df2 = pd.DataFrame([[13,‘14’,15],[16,17,‘18’]],columns=list(‘ABC...原创 2019-04-16 10:37:57 · 990 阅读 · 0 评论 -
利用线性回归熟悉机器学习基本流程
文章目录mport numpy as npimport matplotlib as mplimport matplotlib.pyplot as pltimport pandas as pdfrom pandas import DataFrameimport timefrom sklearn.model_selection import train_test_split#划分训练集...原创 2019-03-30 06:18:19 · 451 阅读 · 0 评论