机器学习
文章平均质量分 55
机器学习
Mercy92
这个作者很懒,什么都没留下…
展开
-
数据科学包整理
##导入数据from sklearn.datasets import 内置数据集##分类#朴素贝叶斯from sklearn.naive_bayes import GaussianNB#高斯朴素贝叶斯from sklearn.naive_bayes import MultinomialNB#多项式朴素贝叶斯#决策树from sklearn.tree import DecisionTreeClassifier#决策树分类from sklearn.tree import export_原创 2021-07-13 09:53:43 · 165 阅读 · 0 评论 -
AdaBoost营销响应预测
文章目录一、背景介绍二、流程简述三、自定义函数1.导包2.数据集信息1)基本信息查看2).缺失值查看3)样本均衡审查3.数据预处理1)数据类型变换2)NA值替换3)标志变换4.获得最佳参数模型四、训练集数据应用1.加载训练集2.数据审查和预处理3.获取最优参数模型4.建立并训练模型五、预测集数据应用1.加载预测集数据2.数据审查并预处理3.应用模型4.与实际效果比较一、背景介绍前13列是13个特征,最后一列是响应的结果《order.xlsx》sheet1是训练集,sheet2是预测集二、流程简述先原创 2021-01-06 15:06:27 · 1199 阅读 · 1 评论 -
【机器学习-样例】关联规则和频繁样式探勘
一、关联规则通过电影观看记录来找到关联的电影以便推荐1.电影表import pandas as pddf_movie=pd.read_csv('E:/Jupyter workspace/python_for_data_science/Data/movies.csv')df_movie.head()2.观影记录表df = pd.read_csv('E:/Jupyter workspace/python_for_data_science/Data/ratings.csv')df.head()原创 2020-11-13 17:45:23 · 319 阅读 · 0 评论 -
【机器学习-样例】降维模型
降维原因:不同特征之间有的互相影响的。具有重叠性,进而影响到统计结果的真实性,所以需要降低维度降维应用:组合浓缩特征剔除不必要的特征降维方法:选择特征 Feature Selection抽取特征 Feature Extraction一、 Feature Selection方差选择法-移除低变异数的特征-VarianceThresholdimport pandas as pddf=pd.pandas.read_csv('E:/Jupyter workspace/python_for_data原创 2020-11-04 14:48:10 · 951 阅读 · 0 评论 -
【机器学习-样例】聚类模型
階層式分群(hierarchical clustering) 聚合式階層分群法 Agglomerative Hierarchical Clustering 分裂式階層分群法 Divisive Hierarchical Clustering 最佳分群群數(Determining Optimal Clusters)切割式分群(partitional clustering) K-means K-medoid 最佳分群群數(Determining Optimal C原创 2020-10-20 15:57:55 · 1603 阅读 · 0 评论 -
【机器学习-样例】模型验证
from sklearn.datasets import load_irisiris=load_iris()X=iris.datay=iris.targetfrom sklearn.linear_model import LogisticRegressionlr=LogisticRegression()lr.fit(iris.data,iris.target)yfit=lr.predict(X)1.准确率得分accuracy_score#sum(y==yfit)/len(y)f原创 2020-10-14 18:57:34 · 782 阅读 · 1 评论 -
【机器学习-样例】分类模型
支持向量机SVM既可用于分类,也可用于回归决策树决断条件:entropy 熵:用来度量混乱基尼不纯度0.94很高,无法做决定加入天气因素这样决策难度减少信息增益原创 2020-09-30 09:54:31 · 564 阅读 · 0 评论 -
【机器学习-样例】线型回归
一、数据简介这是一个简单的工作年限和薪资数据表import pandas as pddf=pd.read_csv(r'E:\Data\salary.csv',index_col=0)#指定索引列df.head()绘图观察%matplotlib inlineimport matplotlib.pyplot as pltimport seaborn as sns; sns.set()import numpy as npx=df['year']y=df['salary']plt.sc原创 2020-09-25 15:44:01 · 246 阅读 · 0 评论 -
朴素贝叶斯分类
朴素贝叶斯模型是一组非常简单快速的分类算法,通常适用于维度非常高的数据集。因为运行速度快,而且可调参数少,因此非常适合分类问题提供快速粗糙的基本方案。一、贝叶斯分类贝叶斯定理论:P(特征):(测试集中)某特征出现的概率P (L):(训练集中)L类标签所占比重,先验概率P (特征 | L ):L类标签出现某特征的概率,似然函数(生成模型帮我们计算)P (L | 特征 ):具有某特征的样本属于L类标签的概率,后验概率每种标签设置生成模型是贝叶斯分类器训练过程的主要部分。“朴素”,如果对每种标签的原创 2020-09-16 17:24:13 · 1303 阅读 · 0 评论 -
【机器学习】简介+Scikit-Learn介绍+超参数和模型验证+特征工程
机器学习方法应用在数据科学领域,把他看作是一种数学建模更合适。机器学习本质就是借助数学模型理解数据。给模型装上可以适应观测数据的可调参数时,学习就开始了。此时程序就具有从数据中学习的能力。一旦模型可以你和旧的观测数据,那么它们就可以预测并解释新的观测数据5.1 机器学习简介一、机器学习的分类有监督学习:指对数据的若干特征与若干标签(类型)之间的关联性进行建模的过程分类classification回归regression无监督学习:指对不带任何标签的数据特征进行建模聚类dementi原创 2020-09-09 17:57:17 · 1107 阅读 · 0 评论