机器学习
监督学习、无监督学习、深度学习
小笼包xiaolongbao
想从事数据分析,甚至梦想数据挖掘的浙大理科生
展开
-
关联规则(Apriori FP Tree算法)
关联分析直观理解频繁项集(frequent itemset)是指那些经常出现在一起的物品集合,比如{葡萄酒,尿布, 豆奶}就是频繁项集的一个例子。一般我们使用三个指标来度量一个关联规则,这三个指标分别是:支持度、置信度和提升度。Support(支持度):表示同时包含A和B的事务占所有事务的比例。如果用P(A)表示使用A事务的比例,那么Support=P(A&B)Conf...原创 2020-02-12 22:03:50 · 798 阅读 · 0 评论 -
决策树算法
决策树构造实例:这个就不详细讲了,大家知道树的结构就行了ID3:信息增益(有什么问题呢?)C4.5:信息增益率(解决ID3问题,考虑自身熵情况)CART:使用GINI系数来当作衡量标准决策树的剪枝:预剪枝,后剪枝原创 2020-02-12 16:32:12 · 1093 阅读 · 0 评论 -
相似度类型
相似度计算相似度的计算一般是基于向量的,可以将一个用户对所有的物品的偏好作为一个向量来计算用户之间的相似度,或者将所有用户对于某一个物品的偏好作为一个向量计算物品之间的相似度,相似度的计算有下列几种方式:计算欧几里得距离:利用欧几里得距离计算相似度时,将相似度定义如下:皮尔逊相关系数:其中sx,sy表示x和y的标准差。Cosine相似度:Tanimoto系数,也称作Jacca...原创 2020-02-12 14:01:39 · 253 阅读 · 0 评论