自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 【Python实例第11讲】文本的核外分类

机器学习训练营——机器学习爱好者的自由交流空间(qq 群号:696721295)这个例子显示scikit-learn怎样进行OOC(out-of-core)分类。所谓核外方法(OOC approach), 指的是从未经内存的数据学习。在这里,我们利用一个支持partial_fit方法的在线分类器学习。为了确保特征空间在不同的时刻仍是相同的,我们利用HashingVectorizer, 它把每...

2018-10-27 08:57:27 390

原创 【Python实例第10讲】可视化股票市场结构

机器学习训练营——机器学习爱好者的自由交流空间(qq 群号:696721295)本例采用几个无监督学习技术,从股票的历史报价变异里提取股票市场结构。这里,我们使用的数量是每日的报价变异。学习一个图结构我们使用稀疏的可逆协方差估计寻找哪些报价是条件相关的,即,给定其它报价下,它们是相关的。特别地,稀疏的可逆协方差估计给出了一个图,这个图实际上是一个报价的连接表。对于每一个标记(即报价),与...

2018-10-23 18:23:10 2967

原创 【Python实例第9讲】物种分布模型

机器学习训练营——机器学习爱好者的自由交流空间(qq 群号:696721295)建立物种的地理分布模型,是保护生物学的一个重要问题。在这个例子里,我们将根据已有的历史观测和14个环境变量,建立两个南美洲哺乳动物类的地理分布模型。这两个物种分别是:褐喉树懒(Bradypus variegatus)森林小稻鼠(Microryzomys minutus)数据集介绍本例使用的物种分...

2018-10-18 18:39:40 7202 2

原创 【Python实例第8讲】模型复杂度影响

机器学习训练营——机器学习爱好者的自由交流空间(qq 群号:696721295)本讲介绍模型复杂度怎样影响预测精度和计算性能。我们使用的数据集仍然是波士顿房价数据集。对于模型的每一类,我们通过选择有关的模型参数,度量计算性能和预测功效的影响,以此考察模型的复杂度。下面,我们用Python代码解释原理。代码详解首先,加载必须的Python函数库。print(__doc__)# Aut...

2018-10-14 12:58:35 1076

原创 【Python实例第7讲】真实数据集的异常检测

机器学习训练营——机器学习爱好者的自由交流空间(qq 群号:696721295)在这个例子里,我们阐述在真实数据集上的稳健协方差估计的必要性。这样的协方差估计,对异常点检测,以及更好地理解数据结构都是有益的。为了方便数据可视化,我们选择来自波士顿房价数据集的两个变量组成的二维数据集作为示例数据集。在下面的例子里,主要的结果是经验协方差估计,它受观测数据形态的影响很大。但是,我们仍然假设数据...

2018-10-10 19:13:01 4058 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除