![](https://img-blog.csdnimg.cn/b43cc6ff217546bf865c9a4d8ef9879b.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224)
机器学习实战
《机器学习实战》中的代码
Fight_adu
这个作者很懒,什么都没留下…
展开
-
第五章 Logistic回归--分类算法大比拼
#分类算法大比拼#-----------------------1、导入数据集-----------------------------#导入数据import pandas as pd#导入数据dataSet=pd.read_csv('../MLinAction_source/Social_Network_Ads.csv')print(dataSet.head())#探索数据print(dataSet.shape)print(dataSet.info())#-----------原创 2022-01-07 20:50:15 · 494 阅读 · 0 评论 -
第五章 Logistic回归--银行营销
#使用逻辑回归实现银行营销#导入数据集,这分割符号为';'#-----------------------------------------1、导入数据集-----------------------------------------------import pandas as pdbankSet=pd.read_csv('../MLinAction_source/bank-full.csv',sep=';')#检查是否有缺失值print(bankSet.isnull().sum())原创 2022-01-07 19:54:15 · 1320 阅读 · 0 评论 -
第五章 Logistic回归--预测病马的死亡率
#使用逻辑回归预测病马的死亡率import numpy as npimport pandas as pd#训练集train=pd.read_table('../MLinAction_source/horseColicTraining.txt',header=None)#测试集test=pd.read_table('../MLinAction_source/horseColicTest.txt',header=None)def sigmoid(inx): s=1/(1+np.exp原创 2022-01-07 16:24:20 · 1326 阅读 · 0 评论 -
第五章 Logistic回归
#Logistic回归#1、--------------------使用BGD(批量梯度下降)求解逻辑回归-----------------#伪代码'''每个回归系数初始化为1重复下面步骤直至收敛: 计算整个数据集的梯度 使用alpha*gradient更新回归系数的向量返回回归系数'''#导入数据集import pandas as pdimport numpy as npimport matplotlib.pyplot as pltdataSet=pd.read原创 2022-01-05 19:13:12 · 635 阅读 · 0 评论 -
第四章 朴素贝叶斯-Kaggle比赛之“旧金山犯罪分类预测“
#Kaggle比赛之"旧金山犯罪分类预测"#导入相应的包import pandas as pdfrom sklearn.preprocessing import LabelEncoderfrom sklearn.naive_bayes import BernoulliNBfrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import accuracy_scorefrom sklearn.metric原创 2022-01-01 10:31:56 · 1458 阅读 · 1 评论 -
第四章 朴素贝叶斯-垃圾邮件过滤
#朴素贝叶斯之垃圾邮件过滤import os#----------------------1、获取数据集-----------------------import pandas as pd''' 函数功能:创建实验数据集 参数:无参数 返回: dataSet:带标签的实验数据集(DF格式)'''def get_dataSet(): ham=[] #ham目录下25个都要读取 ham(非垃圾邮件) for i in range(1,原创 2021-12-31 20:06:37 · 981 阅读 · 0 评论 -
第四章 朴素贝叶斯
#朴素贝叶斯#GaussianNB:高斯分布(正态分布)的贝叶斯import pandas as pdfrom sklearn.naive_bayes import GaussianNB #高斯贝叶斯from sklearn.model_selection import train_test_split #切分训练集和测试集from sklearn.metrics import accuracy_score #计算准确度#导入数据集from sklearn import datasets原创 2021-12-31 17:00:18 · 487 阅读 · 0 评论 -
第三章 决策树-隐形眼镜
#第三章 决策树from math import logimport operatorimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif']=['SimHei'] #显示中文标签plt.rcParams['axes.unicode_minus']=False #这两行需要手动设置#计算给定数据集的香农熵#H(x)=-∑ p(xi)logp(xi)def calcShannonEnt(dataset):原创 2021-12-29 10:22:21 · 183 阅读 · 0 评论 -
第三章 决策树
#第三章 决策树from math import log#计算给定数据集的香农熵#H(x)=-∑ p(xi)logp(xi)def calcShannonEnt(dataset): numEntries=len(dataset) labelCounts={} for featVec in dataset: #为所有可能分类创建字典 currentLabel=featVec[-1] if currentLabel not in原创 2021-12-28 09:52:51 · 400 阅读 · 0 评论 -
第2章 K-近邻算法 程序2-1
创建ch2.py#k-近邻算法from numpy import *import operatordef createDataSet(): group=array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]]) labels=['A','A','B','B'] return group,labels创建ch2_1.pyimport operatorfrom numpy import *import ch2group,labels=c原创 2021-12-04 15:25:42 · 77 阅读 · 0 评论