数据挖掘
lvweishuai001
这个作者很懒,什么都没留下…
展开
-
数据挖掘的过程
数据挖掘的过程基本分为以下6个步骤:1. 商业理解:数据挖掘不是我们的目的,我们的目的是更好的帮助业务,所以第一步我们要从商业的角度理解项目需求,在这个基础上,在对数据挖掘的目标进行定义2.数据理解:尝试收集部分数据,然后对数据进行探索,包括数据描述、数据质量验证等。这有助于对收集的数据有个初步的认知。3.数据准备:开始收集数据,并对数据进行清洗、数据集成等操作,完成数据挖掘前的准备工作。...原创 2019-04-12 10:38:34 · 1488 阅读 · 0 评论 -
数据挖掘
此分类下的文章是学习极客时间专栏 数据分析45讲 的笔记,只做学习之用原创 2019-04-12 11:01:12 · 77 阅读 · 0 评论 -
数据挖掘的十大算法
数据挖掘的十大算法按照不同的目的将算法分成四类分类算法: C4.5 ,朴素贝叶斯,SVM,KNN ,Adaboost , CART聚类算法: K-Means , EM关联分析:Apriori连接分析:PageRank1.C4.5C4.5 算法是十大算法之首,它是决策树的算法,它在决策树够早过程中就进行了剪枝处理,并且可以处理连续的属性,也能对不完整的数据进行处理。2.朴素贝叶斯算法...原创 2019-04-12 12:13:46 · 532 阅读 · 1 评论 -
学习数据分析需要掌握哪些技能
商业智能BI,数据仓库DW,数据挖掘DM商业智能:百货商店利用数据预测用户购物行为属于商业智能,相比于数据仓库、数据挖掘,它是一个更大的概念。商业智能可以说是基于数据仓库,经过数据挖掘后,得到了商业价值的过程。所以说数据仓库是个近况,数据挖掘是炼金术,而商业报告则是黄金数据仓库:百货商店积累的顾客的消费行为行管会存储在数据仓库中,他可以说是BI这个房子的第几,搭建好DW这个第几只有,才能进行分...原创 2019-04-12 13:00:35 · 658 阅读 · 1 评论 -
数据采集:如何自动化采集数据
一个数据的走势是由多个维度影响的,我们需要通过多源的数据采集,手机到尽可能多的数据维度,同时保证数据的质量,这样才能得到高质量的数据挖掘结果数据源可分为以下四类:开放数据源:政府、企业、高校爬虫抓取:网页、app日志采集:前端采集、后端脚本传感器:图像、测速、热敏如何使用爬虫做抓取:爬虫抓取属于最常见的需求,最直接的方法是使用python编写爬虫代码。在python 爬虫中,基本上...原创 2019-04-12 18:13:00 · 2671 阅读 · 0 评论