自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (1)
  • 收藏
  • 关注

原创 你可能不知道的一些机器学习事儿

你可能不知道的一些机器学习事儿       最近零零碎碎地看了很多机器学习方法的东西,增长了不少新知识。有很多小技巧虽然不会出现在教科书中,但它们真的很实用。(1)随机森林模型不适合用稀疏特征。(2)测试集必须使用与训练集相同的方法进行预处理。(3)L1正则(特征选择)最小样本数目m与特征n呈log关系,m = O(log n) ;         L2正则(旋转不变)最小样本

2015-08-31 20:44:52 1095

原创 2015年机器学习/数据挖掘面试总结

2015年机器学习/数据挖掘面试总结       明年硕士毕业,今年开始找工作。在北方呆的太久,想回湿润的南方。       第一站(3月份),阿里数据挖掘实习生面试。个人觉得,阿里的面试是最人性化的,几乎不需要提前准备什么。不需要刷题,不需要死记硬背一些概念。他们看重的是你的项目经历和解决实际问题的能力。每一场面试都不难,但是面试的次数是我所知道的公司中最多的。面试的题目有:1)自我

2015-08-31 13:42:34 4426 1

原创 机器学习漫谈

机器学习漫谈            数据挖掘/机器学习项目一般包括四个关键部分,分别是,数据分析,特征工程,建立模型,验证。1     数据分析         从广义上讲,数据分析包括数据收集,数据处理,数据清洗,探究性数据分析,建模和算法设计,数据可视化等等[1]。从狭义上讲,数据分析指的是探究性数据分析(EDA)。         所谓探索性数据分析(ExploratoryD

2015-08-12 19:13:18 2854

原创 半监督学习漫谈

半监督学习漫谈       机器学习主要分三种形式,监督学习、非监督学习、半监督学习。最常见的是监督学习中的分类问题。监督学习的训练样本都含有“label”,非监督学习的训练样本中都不含“label”,半监督学习介于监督学习和非监督学习之间。在半监督学习领域,半监督分类问题是最受欢迎的,比如蛋白质搜索引擎中的后处理过程就常常采用半监督学习框架进行过滤。       在监督学习中,因为训练集

2015-08-31 23:04:53 1172

操作系统实验的代码

操作系统实验的代码,有4个,2个关于进程,2个关于内存分配

2013-08-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除