机器学习/数据挖掘
文章平均质量分 70
back-to-back
忙忙碌碌终日,终于一事无成。
展开
-
数据挖掘/机器学习 之 开新坑
之前的博客一直是关于LeetCode的内容,接下来除了这个外我还会写关于数据挖掘/机器学习的一些东西,开一个新的坑。这个一个方向将会是我的重心,近期的计划包括:面试经验书籍阅读笔记自己的一些感想和经验在这里我先介绍下我的心路历程:我本科和研究生的方向和数据挖掘/机器学习其实不太沾边,甚至和计算机都太沾边。自己之所以私下里搞这个方向主要是自己真的很喜欢,本科时喜欢玩每天过的比较潇原创 2016-04-10 23:08:59 · 432 阅读 · 0 评论 -
数据挖掘/机器学习 之 聚类
聚类:对点集进行考察并按照某种距离测度将他们聚成多个簇的过程,目标是使得同一个簇内的点之间距离比较短,不同簇中点的距离较大一般是从给定的数据中发现簇,尤其是大数据量及高维空间或非欧空间点集是一种适合于聚类的数据集,每个点都是某空间下的对象,能够进行聚类的所有空间都有一个距离测度,即空间下任意两点的距离聚类策略:层次(hierarchical或者凝聚式agglomerativ原创 2016-04-11 17:17:01 · 768 阅读 · 0 评论 -
数据挖掘/机器学习 之 面试总结
从过年到现在我找实习,先后面了:新浪微博,360,支付宝,百度地图,岗位都是关于数据挖掘和机器学习的,现在把面试经验总结如下:简历的问题,要为每一个岗位做特定的简历,简历上和这个岗位无关的东西最好不要写或者少些,比如我去新浪微博面试,面试官上来就说我是搞通信的不懂机器学习啥的。。。当时还没有经验简历上无关的东西确实多。由于机器学习中的模型算法特别的多,面试时面试官也不会全问,一般都会让原创 2016-04-11 22:09:28 · 2702 阅读 · 0 评论 -
数据挖掘/机器学习 之 距离测度
某空间下的距离测度是一个函数d(x,y),该函数满足下列准则:d(x,y)>=0 (距离非负)d(x,y)=0,当且仅当x=yd(x,y)=d(y,x)(对称性)d(x,y)常见的有:欧氏距离Jaccard距离余弦距离编辑距离:两个字符串x,y把x替换为y所需要的单支付插入及删除操作的最小数目,一种计算的方法是:找到最长公共子序列(LCS),编辑距离等于x与y的长度原创 2016-04-11 21:15:17 · 2425 阅读 · 0 评论