![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习实战
文章平均质量分 86
西湖太极熊
一切用数据说话,用产品触达心灵!
展开
-
我在阿里做数据分析师,一位阿里数据分析师的日常
截止今天我离开阿里已经有5个年头了,在阿里的1000多个日子里,我一直从事数据分析师的工作。今天总结一下过去的工作日常,详细讲述一下我的日常工作中都做了些什么?主要用到哪些分析工具,分析方法,锻炼了哪些能力,日常用作会运用到哪些能力呢?1、快速熟悉业务和数据库数据在刚进入阿里的时候,我进入一个事业部作为一个运营数据分析师,负责部门部分业务。首先,和大多数公司一样会有导师和很多非常nice的同事先帮助你了解你所在部门的业务,当然在阿里你需要更快速的进入状态了解业务,当你初步了解业务之后,作为一个分析.原创 2021-03-31 10:36:54 · 376 阅读 · 0 评论 -
机器学习实战:K-近邻算法(KNN)
KNNK-近邻算法原理欧几里得距离公式:伪代码原理计算已知类别数据集中的点与当前点之间的距离按照距离递增次序排序选取与当前点距离最小的K个点确定前K个点所在类别的出现频率返回前K个点出现频率最高的类别作为当前点的预测分类详细代码#coding=utf-8'''列表:创建一个列表,只要把逗号分隔的不同的数据项使用方括号括起来即可。如下:labe...原创 2018-04-20 14:29:50 · 299 阅读 · 0 评论 -
机器学习实战:降维方法
降维方法主成分分析(Principal Component Analysis,PCA)因子分析(Factor Analysis)独立成分分析(Independent Component Analysis,ICA)主成分分析:PCA伪代码如下 去除平均值计算协方差矩阵计算协方差矩阵的特征值和特征向量将特征值从大到小排序保留最上面的N个特征向量将数据转换到上述N个...原创 2018-04-20 14:04:55 · 486 阅读 · 0 评论 -
机器学习实战
机器学习十大算法KNN算法算法原理k-近邻算法采用测量不同特征值之间的距离方法进行分类。 距离公式:欧氏距离伪代码计算已知类别数据集中的点与当前点之间的距离;按照距离递增次序排序;选取与当前点距离最小的k个点;确定前k个点所在类别的出现频率;返回前k个点出现频率最高的类别作为当前点的预测分类;def classify0(inX,dataSet,la...原创 2018-04-25 14:03:09 · 288 阅读 · 0 评论