机器学习100天
STILLxjy
不要让任何人打乱你生活的节奏
展开
-
机器学习100天-K邻近法 [KNN算法思想 + KNeighborsClassifier]
K-NN算法计算过程:上述过程(1)(2)(3)在寻找k个最近点时,采用了暴力搜索的思想。也可以采取其他算法寻找处最近的k个点,如:BallTree, KDTree等。计算流程事例:(1)(2)(3)(4)sklearn.neighbors.KNeighborsClassifier 参数说明:官方API:https://scikit-learn.org/stable...原创 2019-01-18 15:33:47 · 802 阅读 · 0 评论 -
机器学习100天-数据预处理 [代码实现细节分析]
原始数据: 在Data.csv文件中我们有如下数据:统计了10个人的基本信息:国籍,年龄,工资 以及他们对于某件商品是否购买的情况。代码实现细节分析:(1)导入基本python包import numpy as npimport pandas as pd(2)导入数据,读取.csv文件中的数据dataset = pd.read_csv('Data.csv') #读取指定.csv文...原创 2019-01-15 17:51:23 · 1075 阅读 · 0 评论 -
机器学习100天-简单线性回归 [代码实现细节分析]
预测学生 学习时间 与 考试分数 之间的关系原始数据:(1)导入python包,加载.csv文件中的数据import numpy as npimport pandas as pdimport matplotlib.pyplot as pltdataset = pd.read_csv('studentscores.csv')X = dataset.iloc[:,:1].value...原创 2019-01-15 19:30:16 · 906 阅读 · 0 评论 -
机器学习100天-多元线性回归 [代码实现细节分析]
原始数据:(1)导入库import pandas as pdimport numpy as np(2)导入数据集:数据中存在值为0的丢失数据情况dataset = pd.read_csv('50_Startups.csv')X = dataset.iloc[ : , :-1].valuesY = dataset.iloc[ : , 4 ].values(3)数据预处理...原创 2019-01-15 20:57:24 · 1549 阅读 · 1 评论 -
机器学习100天-逻辑回归 [ 混淆矩阵, np.meshgrid(),np.ravel() ]
相关知识点:1 混淆矩阵 confusion_matrix : 混淆矩阵类似于混淆矩阵也称误差矩阵,是表示精度评价的一种标准格式,用n行n列的矩阵形式来表示。混淆矩阵的每一列代表了预测类别 ,每一列的总数表示预测为该类别的数据的数目;每一行代表了数据的真实归属类别,每一行的数据总数表示该类别的数据实例的数目。如有150个样本数据,预测为1,2,3类各为50个。分类结束后得到的混淆矩阵为:...原创 2019-01-16 21:39:02 · 2853 阅读 · 1 评论