![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 90
JTZ001
大数据工程师
展开
-
Mahout实践:Mahout分类算法-11
Mahout实践:Mahout 分类算法1、实验描述本实验在Hadoop集群已经部署的前提下,使得mahout运行local模式下,然后做mahout的分类算法分析。实验时长:45分钟主要步骤:打开hadoop集群数据准备修改mahout相关环境变量数据预处理训练分类器测试分类器2、实验环境虚拟机数量:3系统版本:CentOS 7.5Mahout版本:apache-mahout-distribution-0.13.0Hadoop版本:Hadoop 2.原创 2021-12-30 17:11:12 · 1965 阅读 · 0 评论 -
机器学习入门:主题模型-4
机器学习入门:主题模型1、实验描述本实验是关于主题模型LDA的,首先介绍了LDA的应用方面有哪些?然后通过以python编程方式调用LDA相关的API,实现对LDA自带数据集的文档主题的分析,并将最终结果可视化。实验时长:45分钟主要步骤:导入实验相关的包加载lda数据集观察数据样本利用特定的样本做测试创建LDA模型分析文档的主题分布计算对应主题的TOP N单词结果展示2、实验环境虚拟机数量:1系统版本:CentOS 7.5LDA版本:1.0.5scikit-l原创 2021-12-21 17:50:33 · 146 阅读 · 0 评论 -
机器学习:主题模型
机器学习入门:主题模型1、实验描述本实验是关于主题模型LDA的,首先介绍了LDA的应用方面有哪些?然后通过以python编程方式调用LDA相关的API,实现对LDA自带数据集的文档主题的分析,并将最终结果可视化。实验时长:45分钟主要步骤:导入实验相关的包加载lda数据集观察数据样本利用特定的样本做测试创建LDA模型分析文档的主题分布计算对应主题的TOP N单词结果展示2、实验环境虚拟机数量:1系统版本:CentOS 7.5LDA版本:1.0.5sci原创 2021-04-14 14:25:13 · 409 阅读 · 0 评论 -
机器学习:最大期望算法
机器学习入门:最大期望算法1、实验描述本实验通过使用EM算法解决部分观测数据的参数估计的难题,利用scikit-learn提供的EM模块,实现EM算法,创建模型,训练模型,然后利用模型计算均值、方差着数据,并最终用3d图示可视化结果。实验时长:45分钟主要步骤:设定随机种子数给定均值和方差生成模拟样本建立混合高斯模型利用样本,训练模型模型评估结果可视化2、实验环境虚拟机数量:1系统版本:CentOS 7.5scikit-lear原创 2021-04-14 14:07:35 · 414 阅读 · 0 评论 -
机器学习:逻辑回归
机器学习入门:逻辑回归1、实验描述本实验主要内容是,通过使用pandas对鸢尾花数据集进预处理,根据预处理数据建立logistics regression模型,并训练模型,再利用训练出来的模型做预测,并最终使用图形的方式展示预测结果。实验时长:45分钟主要步骤:加载iris数据集读取对应的标签和特征将标签值从string映射整数型对特征做标准化和映射多项式特征集模型创建模型的预测模型评估结果展示2、实验环境虚拟机数量:1系原创 2021-04-14 14:01:12 · 446 阅读 · 0 评论 -
机器学习:线性回归
机器学习入门:线性回归1、实验描述本实验中提供一份关于产品广告费用与对应产品销量的数据文件Advertising.csv文件,利用此文件建立线性模型、训练模型、用模型做预测分析。实验时长:45分钟主要步骤:加载csv文件获得标签和特征数据展示标签和特征的关系图切分数据集创建模型用模型做预测模型评估2、实验环境虚拟机数量:1系统版本:CentOS 7.5scikit-learn版本: 0.19.2pandas版本:原创 2021-04-14 13:56:55 · 736 阅读 · 0 评论