机器学习
九八年的尾巴
一个愿意分享和倾听的年轻人
展开
-
机器学习-离线运算
pipeline:通道 作用:整合其它算法一起执行 import org.ansj.recognition.impl.StopRecognition import org.ansj.splitWord.analysis.ToAnalysis import org.apache.spark.ml.Pipeline import org.apache.spark.ml.classification.LogisticRegression import org.apache.spark.ml.evaluation.原创 2020-10-13 12:07:10 · 115 阅读 · 0 评论 -
机器学习-推荐系统
package com.mllib import org.apache.spark.mllib.recommendation.{ALS, Rating} import org.apache.spark.sql.SparkSession object MoviesDemo { /* * 推荐 * 两种方式 * 基于人物 * 基于物品 * * 最小二乘法回归,根据原有数据进行预测。把用户评分,商品评分分为两个矩阵进行相乘计算 * */ def main(ar原创 2020-10-08 17:21:41 · 103 阅读 · 0 评论 -
机器学习-聚类算法
和之前讲的两个算法不一样 非监督型类型 检测所有数据的中心来,为源来聚合。但没有一个结果,结果不固定 package com.mllib import org.apache.spark.mllib.clustering.KMeans import org.apache.spark.mllib.linalg.Vectors import org.apache.spark.sql.SparkSession /*** * 共享单车记录数据 */ object ClusteringDemo { de原创 2020-10-07 11:43:08 · 97 阅读 · 0 评论 -
机器学习-分类算法
分类算法 根据特征数据区分属于哪一类 比如微博 发表文章判断属于哪一类,正向还是负向 类别:支持向量机 决策树(本章具体描述决策树) **决策树:**将特征进行划分,进行一些列处理 例子:中午吃饭,兜里钱是否大于20,此时继续判断钱是否大于25,如果大于吃黄焖鸡+可乐,不大于黄焖鸡。如果兜里钱一开始就不大于20吃泡面 object Happiness { /** * 判断人是否幸福 * */ def main(args: Array[String]): Unit = { //原创 2020-10-05 16:47:19 · 118 阅读 · 0 评论 -
机器学习-回归算法
回归模型指标 指标误差 值越小越好 评估回归模型的性能: * 误差归属于越小越好,代表实际值与预测值相差比小 * - 均方误差(MSE: Mean Squared Error) * 预测值和实际值之间的差异 * 所有样本预测值和实际值差的平方之和,除以样本总数 * - 均方根误差(RMSE: Root Mean Squared Error) * 就是均方误差平方根,结果数据更方便描述 * - 平均绝对误差(MAE:Mean Absolute Error) *原创 2020-10-05 16:46:54 · 116 阅读 · 0 评论 -
机器学习初步概念
人工智能 机器学习是人工只能的具体实现(本质上运算) 监督:有结果值 (回归:比如豌豆种子来推算豌豆父亲的样子) (分类:大量数据的分类) (聚类:通过元素去画一个大概的分类,当前的值大概分类去计算,分一个组,其它人去找组长) 非监督:没有标识(应用与聚集 ) 学习:统计现实生活中相同的点和数据进行记录并处理。根据这些数据产生新的数据 深度学习(运算量更大) 人脸识别,机器视觉 向量:有方向的量 x轴2到y轴1 相连起来就代表一个向量,能表达数据更多,或者矩阵原创 2020-10-02 18:35:22 · 105 阅读 · 0 评论