数据处理
冬之晓东
国家对地观测科学数据中心信息发布
展开
-
使用机器学习和数据挖掘算法进行数据处理
数据挖掘和机器学习是进行数据处理的非常有用的工具,当代的好多数据都使用这两种方法。但是这两种方法却包含很多模型和方法,对于初学者来说,面对这些模型总是无从下手。因此,后面的论述主要以处理数据的流程入手,把每个方法带入到数据处理的步骤中来讲,使得这些方法在数据处理中的具体位置有一个清晰的显示,有利于理解这些方法。原创 2017-12-12 21:08:54 · 15695 阅读 · 3 评论 -
使用Python进行层次聚类(二)——scipy中层次聚类的自定义距离度量问题
今天,总结一下如何使用层次聚类算法里面的自定义距离度量 层次聚类上次已经总结过。 这次仅仅说明层次聚类的距离参数,这里的距离参数可以使用自定义函数。 我们进入该函数的文档页面 我们看到linkage的说明文档上面的函数scipy.cluster.hierarchy.linkage(y, method='single', metric='euclidean', optimal_orderin...原创 2018-04-06 15:36:44 · 9231 阅读 · 15 评论 -
使用Python语言进行机器学习工作流的实例分析
最近,在kaggle上找到一位大牛写的机器学习算法总结,感觉流程清晰,内容详实,因此翻译并分享下,由于作者不明原因将原文删除了,所以没法放上原文地址,文中主要以代码实践的方式展开各种算法,原理方面参考文中的地址连接(这是自己加上的),以便时查阅~ 目录 目录 使用Python语言进行机器学习工作流的实例分析 1. 介绍 2. 机器学习工作流程 3 问题定义 3.1 问题特征 3.2 目标...翻译 2018-12-05 08:35:21 · 2085 阅读 · 1 评论 -
凸优化学习(六)——一个简单的对偶实例
2 一个简单的对偶实例 作为对偶的一个简单应用,在本节中,我们将展示如何形成一个简单凸优化问题的对偶问题。考虑如下的凸优化问题: minx∈R2x12+x2subjectto2x1+x2≥4x2≥1 \begin{aligned} \min_{x\in R^2}\quad &x_1^2+x_2 \\ subject\quad to \quad&2x_1+x_2\g...翻译 2019-03-19 21:45:13 · 2509 阅读 · 0 评论