自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 textbook1:推荐系统概述

评分是一种提供反馈的典型方法,但是不容易采集;隐式反馈不像评分清晰明了,但更容易采集。 推荐系统的基本思想就是利用这些不同来源的数据推断顾客的喜好。 推荐系统面向的对象是用户,推荐的产品是物品。 由于用户曾经的兴趣喜好通常预示着未来的选择,推荐分析也通常是基于先前用户与物品之间的关系。但有一特例,基于知识的推荐系统是根据用户指定需求而非历史记录进行推荐。 以用户为中心的活动和以物品为中心的活动之间...

2019-07-22 11:09:23 212

原创 基于内容的推荐算法

基于内容的推荐算法本质是对内容进行分析,建立特征。 物品都有一些关于内容的分类,基于内容的分类,就是根据这些物品的内容属性和用户的历史评分或操作记录,计算出用户对不同内容属性的爱好程度,再根据这些爱好推荐其他相同属性的物品。 内容推荐的方法可归纳为3个步骤: 1.特征提取:提取每个待推荐物品的特征,内容属性,例如电影的特征。 2.用户偏好计算:利用一个用户过去的显式评分或隐式操作记录,计算用户不同...

2019-05-15 20:15:04 620

原创 西瓜书复习:贝叶斯分类器

贝叶斯决策论是概率框架下实施决策的基本方法。对分类任务,贝叶斯决策论考虑如何基于这些概率和误判损失来选择最优的类别标记。 λij:将一个真实标记为cj的样本误分为ci所产生的损失,在样本x上的条件风险为 我们的任务是寻找一个判定准则h,最小化总体风险 即 h为贝叶斯最优分类器,R(h)为贝叶斯风险,1-R(h*)反映了分类器能达到的最好性能。 最小化分类错误率的贝叶斯最优分类器,即对每个样本...

2019-05-14 21:17:14 317

原创 继承、封装、多态、接口

封装 静态域:将域定义为static,每个类只有一个这样的域。这个类的所有实例共享一个静态域。它属于类,不属于任何独立的对象 静态方法:不能向对象实施操作的方法,可认为静态方法是没有this参数的方法。建议使用类名来调用静态方法。 使用静态方法的情况: 一个方法不需要访问对象状态,其所需参数都是通过显示参数提供。 一个方法只需要访问类的静态域。 继承 两个类之间有明显的is-a关系。在Java中,...

2019-05-14 18:58:20 151

原创 Python字典用法总结

dic.items() :返回键+值 的元组

2019-05-07 11:17:41 177

原创 西瓜书复习:支持向量机

在样本空间中,划分超平面的线性方程为: w为法向量,决定了超平面的方向;b为位移项,决定超平面与原点之间的距离。样本中任意点x到超平面(w,b)的距离为: ...

2019-05-04 22:15:11 772

原创 西瓜书复习:决策树

一棵决策树包含一个根结点,若干个内部结点和若干个叶结点。叶结点对应于决策结果,其他每个结点则对应于一个属性测试。 每个结点包含的样本集合根据属性测试的节点被划分到子结点中。根结点包含样本全集,从根结点到每个叶结点的路径对应了一个判定测试序列。决策树学习的目的是为了产生一棵泛化能力强的决策树,其基本流程遵循简单的分治策略。 ...

2019-04-25 20:56:27 648

原创 西瓜书复习:多分类学习

现实中常遇到多分类任务,有些二分类方法也可推广到多分类。 考虑N个类别C1,C2,…,CN,多分类学习的基本思路是拆解法,将多分类任务拆为若干个二分类任务求解。 具体来说,先对问题进行拆分,为拆出的每个二分类任务训练一个分类器,测试时,对这些分类器的预测结果进行集成获得最终分类结果。 最经典的拆分策略有三种 “一对一OVO”: 将N个类别两两配对,产生N(N-1)/2个二分类任务。为区分类别Ci和...

2019-04-24 21:41:35 734

原创 西瓜书复习:线性模型

线性模型试图学一个通过属性的线性组合进行预测的函数,即 一般用向量形式 学得w和b后,模型即确定。w直观表达了各属性在预测中的重要性。 对离散属性,若属性值间存在序关系,可通过连续化将其转化为连续值。若不存在序关系,通常转化为one-hot向量。 回归任务常用均方误差来度量,因此可让均方误差最小化,即 均方误差有很好的几何意义,对应了欧氏距离。可用最小二乘法最小化均方误差来求解模型。最小二乘...

2019-04-21 21:27:29 351

原创 西瓜书复习:模型评估与选择

错误率:分类错误的样本数占样本总数的比例 误差:学习器的实际预测输出与样本的真实输处之间的差异,在训练集上的误差为训练误差或经验误差;在新样本上的误差称为泛化误差。 导致过拟合的最主要因素是学习能力过于强大。过拟合是无法避免的,我们所能做的只是缓解。 留出法:直接将数据集D划分为两个互斥的集合,训练集和测试集。需要注意的是,划分要尽可能保持数据分布的一致性,例如在分类任务中至少要保持样本的类别比例...

2019-04-20 22:27:53 213

原创 西瓜书复习:神经网络

感知机,仅由两层神经元组成,感知机的学习过程: 感知机只有输出层神经元进行激活函数处理,只有一层功能神经元,学习能力非常有限。 前馈神经网络,与感知机相比多了隐层。输入层仅是接受输入,不进行函数处理,隐层与输出层包含功能神经元。 神经网络的学习过程,就是根据训练数据来调整神经元之间的“连接权”以及每个功能神经元的阈值。 ...

2019-04-17 22:15:32 602

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除