自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 《百面机器学习》读书笔记-第二章 模型评估

准确率的局限性 准确率是指分类正确的样本占总样本个数的比例 精确率与召回率的权衡   平方根误差的意外   ROC曲线----受试者工作特征曲线 横坐标为假阳性率,纵坐标为真阳性率 在对模型进行过充分的离线评估之后,为什么还要进行在线A/B测试? 1 离线评估无法完全消除模型过拟合的影响,因此,得出的离线评估结果无法完全替代线上评估结果 2 离线评估无法完全还原线上的工程环境。...

2018-09-03 18:29:03 1062

原创 《百面机器学习》读书笔记-第一章 特征工程

为什么需要对数值类型的特征做归一化? 可以将所有的特征都统一到一个大致相同的数值区间内,通过梯度下降发求解的模型通常是需要归一化的。常用的方法有线性归一化和零均值归一化。 怎样处理类别型特征? 序号编码,独热编码,二进制编码 什么是组合特征?如何处理高维组合特征? 把一阶离散特征两两组合   有哪些文本表示模型?各有什么优缺点? 词袋模型:每篇文章表示成一个长向量,每一维代表一个单...

2018-08-31 16:20:11 1242

sentiment analysis论文笔记

Opinion mining and sentiment analysis笔记评论搜索需要解决下列问题information-gathering行为一个重要的一部分就是发现别人是怎么想的这个调查覆盖率技术和方法观点导向的寻找信息的系统1 用户是否在寻找一个主观材料2 哪些包含了评论性的材料3 区分整体的情感和特殊的观点4 表示情感信息 1 整合可能在不同范围内注册的投票 2 选择性标注一些观点 3...

2018-06-07 00:47:29 351

sentiment analysis论文笔记

Opinion mining and sentiment analysis笔记评论搜索需要解决下列问题information-gathering行为一个重要的一部分就是发现别人是怎么想的这个调查覆盖率技术和方法观点导向的寻找信息的系统1 用户是否在寻找一个主观材料2 哪些包含了评论性的材料3 区分整体的情感和特殊的观点4 表示情感信息 1 整合可能在不同范围内注册的投票 2 选择性标注一些观点 3...

2018-06-05 20:51:49 4201

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除