机器学习
文章平均质量分 92
Zhou1317fe5
这个作者很懒,什么都没留下…
展开
-
机器学习06-推荐系统
假设您经营一家大型电影流媒体网站,用户使用一到五颗星对电影进行评级,请预测用户未看过的电影可能给出的评分。nu:用户数量nm:电影数量rij= 1 :第j个用户对 第i个电影做出评价yij:当rij= 1时,第j个用户对第i个电影的评分假设每一部电影都有一个特征集X,n表示特征数量,x1衡量一部电影为爱情片的程度,x2衡量一部电影为动作片的程度,例如x10.90我们可以把每一个用户的预测评价值当做线性回归问题。对于每个用户 j,需要学习参数w。原创 2023-08-03 21:21:18 · 158 阅读 · 0 评论 -
机器学习05-无监督学习
聚类算法查看大量数据点并自动找到彼此相关或相似的数据点。原创 2023-08-03 21:13:16 · 118 阅读 · 0 评论 -
机器学习04-树模型
在每个节点上,在选择用于划分的特征时,如果有n个可用特征,则从中随机选择一个大小为k(k < n)的特征子集,并只允许算法从该特征子集中进行选择,从中选择出具有最高信息增益的特征进行分支。其中,初始熵是对整个数据集进行计算得到的熵,子集熵是对每个划分子集进行计算得到的熵,子集样本数是每个划分子集中的样本数量,总样本数是整个数据集的样本总数。b等于1到B,我们将训练集放入袋子中,利用有放回抽样选出B次大小为m的新的训练集,我们在这些新的训练集中训练一个个决策树。选出一个新的训练集,训练一个决策树;原创 2023-08-03 21:04:34 · 144 阅读 · 0 评论 -
机器学习03-模型评估
如何评估学习算法,自动选择模型?模型选择&交叉验证测试集的训练方法因为d也是一个需要学习的参数,不断选择d的过程本质上和学习模型内参数w,b是一致的,而超参数d本就是靠在test集上测试找到的,而test集在这里就成为参数d的“训练集”,所以这样得出的d是过拟合的简而言之 Training set 用来 选 w&b, cross validation用来选 d , Test set 用来评估 模型 最终的 泛化误差 - 就是这个模型好不好训练集:得到模型,得到每个模型的w,b。原创 2023-07-23 08:47:46 · 135 阅读 · 0 评论 -
机器学习02-多分类问题
当有四种分类时:aj被解释为给定输入特征x时模型对y等于j的概率。原创 2023-07-23 08:26:36 · 218 阅读 · 0 评论 -
机器学习01-神经网络
要创建另一个神经元来估计人们是否认为这是高质量的短袖。这可能是短袖价格和材料质量的函数。鉴于对可负担性(affordability)、认识程度(awareness)、感知质量(perceived quality)的预测,我们将这三个神经元的输出连接到右侧另一个神经元,然后该神经元输入这三个数字并输出可能成为畅销品的概率。原创 2023-07-20 14:11:54 · 88 阅读 · 1 评论 -
机器学习00-监督学习
fwbxw1x1w2x2...wnxnb如何确定模型中的参数取什么值?用代价函数。原创 2023-07-19 19:04:13 · 37 阅读 · 0 评论