![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
读书笔记
哇我额头好大
行业小白,开始在这里记录自己的学习过程
展开
-
《白话大数据和机器学习》学习笔记1
一、基础篇(了解一些基本概念) 1、大数据分析要做哪些工作:通过建立指标对数据进行统计来发现数据之间的联系。利用数据挖掘和机器学习的方法,发现事件的规律和知识,并对未来事物发展进行预测。 2、做大数据分析需掌握哪些知识:数据库方面的如MySQL、hive等,数据加工如Python语言,统计学知识,数据分析方法如建模、挖掘、机器学习、回归分析、分类聚类等,以及相关的业务知识。 3、什么可以称之为数据...原创 2019-02-06 19:33:26 · 351 阅读 · 0 评论 -
《白话大数据和机器学习》学习笔记2
(对聚类、分类、关联分析、用户画像、推荐算法、文本挖掘、人工神经网络的简单了解) 一、聚类 1、k-means算法是基于向量的距离来进行聚类。 首先从N个向量中任意选k个向量,计算其他N-k个向量与k个中心点的距离; 然后把任意向量与它中心距离最近的归为一类,并重新计算每个类的中心向量的位置; 重复上一步骤,计算与中心向量的距离,使得归类漂移小于1%。 此方法要求指定类的数量和初始类的中心。 2、...原创 2019-02-12 20:03:44 · 357 阅读 · 0 评论