机器学习
九八年的尾巴
一个愿意分享和倾听的年轻人
展开
-
机器学习-离线运算
pipeline:通道作用:整合其它算法一起执行import org.ansj.recognition.impl.StopRecognitionimport org.ansj.splitWord.analysis.ToAnalysisimport org.apache.spark.ml.Pipelineimport org.apache.spark.ml.classification.LogisticRegressionimport org.apache.spark.ml.evaluation.原创 2020-10-13 12:07:10 · 128 阅读 · 0 评论 -
机器学习-推荐系统
package com.mllibimport org.apache.spark.mllib.recommendation.{ALS, Rating}import org.apache.spark.sql.SparkSessionobject MoviesDemo { /* * 推荐 * 两种方式 * 基于人物 * 基于物品 * * 最小二乘法回归,根据原有数据进行预测。把用户评分,商品评分分为两个矩阵进行相乘计算 * */ def main(ar原创 2020-10-08 17:21:41 · 110 阅读 · 0 评论 -
机器学习-聚类算法
和之前讲的两个算法不一样非监督型类型检测所有数据的中心来,为源来聚合。但没有一个结果,结果不固定package com.mllibimport org.apache.spark.mllib.clustering.KMeansimport org.apache.spark.mllib.linalg.Vectorsimport org.apache.spark.sql.SparkSession/*** * 共享单车记录数据 */object ClusteringDemo { de原创 2020-10-07 11:43:08 · 104 阅读 · 0 评论 -
机器学习-分类算法
分类算法根据特征数据区分属于哪一类比如微博 发表文章判断属于哪一类,正向还是负向类别:支持向量机决策树(本章具体描述决策树)**决策树:**将特征进行划分,进行一些列处理例子:中午吃饭,兜里钱是否大于20,此时继续判断钱是否大于25,如果大于吃黄焖鸡+可乐,不大于黄焖鸡。如果兜里钱一开始就不大于20吃泡面object Happiness { /** * 判断人是否幸福 * */ def main(args: Array[String]): Unit = { //原创 2020-10-05 16:47:19 · 137 阅读 · 0 评论 -
机器学习-回归算法
回归模型指标指标误差 值越小越好评估回归模型的性能:* 误差归属于越小越好,代表实际值与预测值相差比小* - 均方误差(MSE: Mean Squared Error)* 预测值和实际值之间的差异* 所有样本预测值和实际值差的平方之和,除以样本总数* - 均方根误差(RMSE: Root Mean Squared Error)* 就是均方误差平方根,结果数据更方便描述* - 平均绝对误差(MAE:Mean Absolute Error)*原创 2020-10-05 16:46:54 · 145 阅读 · 0 评论 -
机器学习初步概念
人工智能 机器学习是人工只能的具体实现(本质上运算) 监督:有结果值 (回归:比如豌豆种子来推算豌豆父亲的样子) (分类:大量数据的分类) (聚类:通过元素去画一个大概的分类,当前的值大概分类去计算,分一个组,其它人去找组长) 非监督:没有标识(应用与聚集 ) 学习:统计现实生活中相同的点和数据进行记录并处理。根据这些数据产生新的数据深度学习(运算量更大) 人脸识别,机器视觉向量:有方向的量x轴2到y轴1 相连起来就代表一个向量,能表达数据更多,或者矩阵原创 2020-10-02 18:35:22 · 118 阅读 · 0 评论