机器学习
文章平均质量分 85
stary_yan
"I believe people express their appreciation to the rest of humanity is to make something wonderful and put it out there."
展开
-
[一点一点入门机器学习] k近邻算法
k-近邻算法概要:k-近邻算法采用测量不同特征值之间的距离方法进行分类。 优点:精度高,对异常值不敏感,无数据输入假定。 缺点:计算复杂度高,空间复杂度高。工作原理是:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集合中每一个数据与所属分类的对应关系。简单例子k-近邻算法其实就是计算预测点与所有已知点(算法样本集)的距离(近似值),然后根据近似值就小的来原创 2016-10-03 21:24:54 · 525 阅读 · 0 评论 -
遗传算法解决背包问题
遗传算法解决背包问题 遗传算法可以认为是一种启发式算法,根据达尔文的进化学说中“优胜劣汰”、“适者生存”的观点来解决一些实际生活中难以解决的问题。其实简单来说,遗传算法所做的事情就是“随机”生成一些可行解(不是最优解),然后随机一段时间之后找到局部最优解。但是这个“随机”的过程模拟了自然界中的进化规律,也是“更优解”更容易生存,“更优解”与“更优解”的结合能够生成“更更优解”。不断重复这个结合的原创 2017-08-07 16:37:54 · 5408 阅读 · 0 评论 -
基于机器学习的NLP情感分析(一)---- 数据采集与词向量构造方法(京东商品评论情感分析)
基于机器学习的NLP情感分析(一)—- 数据采集与词向量构造方法 最近实习期间在做一个对新闻文本情感分析的项目。在此,用京东的商品评论练手,从数据采集到模型实现完整地写一遍,以备未来回顾所需。事实上,我采用的方法并不困难,甚至有点naive,所以权且作为练手吧。数据采集在这里为了避免人工标注的麻烦,使用的是京东iPad的用户评论。事实上,NLP情感分析中最花时间的就是人工标注。仔细查看调试台可原创 2017-07-18 17:06:29 · 25142 阅读 · 8 评论 -
[机器学习]回归分析案例 --- 网游排名分析
[机器学习]回归分析案例 — 网游排名分析项目描述案例来自狗熊会。 基础案例 | 玩家必看之网游排行big picture从项目描述以及数据上看,可以很明显地发现,这是一个非常文本化的数据,也就是无法直接使用机器学习来解决问题。那么,这就非常依赖于将文本量化的能力。本文,我会尝试着完整地把整个项目实现一遍,并给出我的一些理解和感悟。Research首先,我们需要对文本数据有一个大体的认识。各字段的原创 2017-07-28 20:24:17 · 1302 阅读 · 0 评论