自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

高毅的博客

发现 探索 分享

  • 博客(5)
  • 收藏
  • 关注

原创 模型评估与选择(二)

某天晚上看了斯坦福大学一节machine learning课程,新潮澎湃,遂在网上找到周老师的《机器学习》看了下,以下内容属于学习记录性质的,仅供梳理知识点。经验误差:学习器在训练集上的误差,称为“训练误差”或“经验误差”。过拟合:当学习器把训练样本学得“太好”了的时候,很可能把训练样本本身的一些特点当作了所有潜在样本都具有的一般性质,导致泛华能力下降,这种现象称为“过拟合”。欠拟

2016-10-26 13:44:48 767

原创 机器学习基本术语

分类(classification):若我们欲预测的是离散值,如“好瓜”“坏瓜”,此类学习任务成为“分类”。(有导师学习)回归(regression):若预测的是连续值,如西瓜成熟度0.65,0.78,此类学习任务称为“回归”。(有导师学习)聚类(clustering):将训练集分成若干组(簇),这些簇可能对应一些潜在的概念划分,如“浅色瓜”“深色瓜”。注:在聚类学习中,“浅色瓜”“深色瓜

2016-10-25 11:16:10 859

原创 有向无环图及其在汉语分词中的应用

在汉语分词方法中,有一种称为“N-最短路径方法”的分词方法。该方法是一种旨在提高召回率并兼顾准确率的词语粗分模型。下面回顾有向无环图的相关知识。AOE-网(Activity On Edge)即边表示活动的网。AOE-网是一个带权的有向无环图,顶点表示事件,弧表示活动,权表示活动持续的时间。AOE-网通常用来估算工程的完成时间。如下是一个AOE-网。在用其表示工程的进度时

2016-10-22 13:36:28 1426

原创 Elasticsearch基于RESTful接口的索引操作

从研究ES到现在有一个月了,之前搭建环境什么的,做的都比较匆忙,现在在做ES的性能测试,空余时间把相关的操作整理下。1、查询索引配置http://localhost:9200/_all/_settings/  ,可查询所有索引的配置信息,查询结果如下{"new_index": {"settings": {"index": {"creation_date"

2016-10-21 14:22:18 3014

原创 Hadoop实战---安装

把Hadoop用于搜索引擎的分布式存储,故总结下Hadoop的相关知识:Hadoop的安装:1、获取Linux操作系统,我的是Ubuntu 16.42、在Ubuntu上安装jdk3、配置Hadoop-->下载Hadoop:wget http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-1.2.1/hadoop-1.2.

2016-10-07 22:11:02 403

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除