![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Data Mining
文章平均质量分 81
JoyceCoder
质量和效率是基本的自律
展开
-
航空公司客户价值分析
实验介绍信息时代的到来使得企业的营销焦点从产品中心转为了客户中心,为实现企业利润最大化目标。准确的对客户进行分类,根据分类结果制定个性化服务方案,优化企业营销资源分配方案。在航空营销行业中,各个航空公司通过推出更优惠的营销方式来吸引更多的客户,而通过建立合理的客户价值评估模型,对客户进行分群,分析比较不同群体的客户价值,并制定相应的营销策略,对不同的客户群提供个性化的客户服务是必须和有效的。 ...原创 2018-09-11 17:12:59 · 7297 阅读 · 3 评论 -
《数据挖掘概念与技术》第九章 分类:高级方法
本章继上一章中介绍的基本分类方法后,又介绍了分类的高级方法:贝叶斯网络在贝叶斯网络中,不强调变量之间的独立性。承认变量或属性间的依赖关系。在给定的网络拓扑图中,给定概念。一条弧由节点Y到Z,则Y是Z的双亲或直接前驱,而Z是Y的后代。给定其双亲,每个变量条件独立于图中它的非后代。这也说明对于每个变量,应考虑她的双亲节点的所有可能取值的组合情况下,变量取值的概率。即P(Y∣Parents...原创 2019-01-14 15:28:35 · 953 阅读 · 0 评论 -
基于基站定位数据的商圈分析
基于基站定位数据的商圈分析目录基于基站定位数据的商圈分析实验介绍**实验背景****实验目标**实验分析方法与过程**分析流程**数据抽取分析**数据抽取****数据分析**数据预处理数据规约数据变换模型构建——层次聚类算法**层次聚类**模型分析由于本书中很多没有给出最原始的数据。多是处理过程中的数据,失去了很多做数据特征工程的训练。以后会更加注重kaggle比赛上的数据特征分析。实验介...原创 2019-01-08 09:39:28 · 4902 阅读 · 3 评论 -
《数据挖掘概念与技术》第七章 高级模式挖掘
频繁模式挖掘是数据挖掘中频繁项挖掘的基本目标。另外包括闭频繁项模式和极大频繁项模式。除了挖掘基本的频繁项集和关联外,还可以挖掘高级的模式形式,本章中分别介绍了:多层关联多维关联量化关联规则稀有模式负模式高维模式模式压缩和近似模式多层关联多层关联涉及多个抽象层中的数据。例如戴尔电脑可以抽象到电脑,而索尼耳机可以抽象到耳机。这些可以使用多个最小支持度阈值挖掘。对于多层关联模...原创 2019-01-07 11:44:27 · 1961 阅读 · 0 评论 -
10分钟学习pandas
import pandas as pdimport numpy as npimport matplotlib.pyplot as plts = pd.Series([1,3,5,np.nan,6,8])s0 1.01 3.02 5.03 NaN4 6.05 8.0dtype: float64len(s)6s.descri...翻译 2019-01-04 11:36:04 · 371 阅读 · 3 评论 -
《数据挖掘概念与技术》 第6章 挖掘频繁模式
挖掘频繁模式、关联和相关性目录挖掘频繁模式、关联和相关性Apriori算法**数据挖掘与机器学习****Apriori算法**发现频繁项集发现关联规则FP-Growth算法**1.FP-Growth算法****2.FP树**构建FP树数据结构构建FP树**1.抽取条件模式基****2.创建条件FP树**闭频繁项集和极大频繁项集模式评估度量方法Apriori算法Apriori算法是一种用于关联...原创 2019-01-03 15:58:01 · 1989 阅读 · 0 评论 -
《数据挖掘概念与技术》书记 1
《数据挖掘概念与技术》书记有感知识点:数据挖掘的进化过程:数据库和信息技术->数据库系统->高级数据库系统;高级数据分析的数据仓库、数据挖掘;基于web的数据库->数据仓库数据仓库:一种多个异构数据在单个站点以统一的模式组织的存储,以支持管理决策。数据仓库技术包括数据清理、数据集成和联机分析处理(OLAP)。OLAP是一种分析技术,具有汇总、合并和聚集以及不同的角度观...原创 2018-12-18 16:38:04 · 429 阅读 · 0 评论 -
《数据挖掘概念与技术》书记 3
数据预处理欢迎来到现实世界!数据预处理技术:数据清理:用来清除数据中的噪声,纠正不一致。数据集成:将数据由多个数据源合并成一个一致的数据存储,如数据仓库。数据规约:通过如聚集、删除冗余特征或聚类来降低数据的规模。数据变换:可以用来把数据压缩到较小的区间。这些技术不是互相排斥的,可以一起使用。数据清理可能涉及纠正错误数据的变换。数据质量数据质量包括准确性、完整性、一致性、时效性...原创 2018-12-20 16:17:31 · 319 阅读 · 0 评论 -
《数据挖掘概念与技术》书记2
认识数据目标:熟悉数据将解决什么问题?数据由什么类型的属性或字段组成?每个属性具有何种类型的数据值?哪些属性是离散的,哪些是连续的?数据看上去如何?值如何分布?有什么方法可以可视化地观察数据?是否可以看出离群点?可以度量某些数据对象与其他数据对象之间的相似性?数据对象与属性类型数据对象数据集由数据对象组成,一个数据对象代表一个实体。比如在销售数据库中,对象可以是顾客、...原创 2018-12-19 15:42:59 · 811 阅读 · 0 评论 -
应用系统负载分析与磁盘容量预测
参考:https://blog.csdn.net/qq_40006058/article/details/80627357https://blog.csdn.net/sinat_33519513/article/details/79036958https://blog.csdn.net/huang1024rui/article/details/51375990https://blog.cs...原创 2018-10-03 20:12:36 · 3962 阅读 · 1 评论 -
基于水色图像的水质评价
基于水色图像的水质评价(完整代码)实验介绍水质的好坏跟水色有一定关系,有经验的从事渔业生产的从业者可通过观察水色变化调控水质。本次实战的目标是通过水色图像实现水质的自动评价。下面水色与水质的关系表:数据探索分析数据源在‘data/images’目录下给出了某地区的多个罗非鱼池塘水样的数据,根据上节给出的水产专家按水色判断水质分类的数据表来对数据进行探索分析。每个水质图片的命名规则为...原创 2018-10-02 17:24:21 · 6701 阅读 · 6 评论 -
《数据挖掘概念与技术》第八章 分类:基本概念
分类本章中讲到了三种分类方法:决策树分类在决策树分类中详细介绍了三种决策树的属性选择度量:信息增益分区D为标记类元组的训练集。D的熵,即所需要的期望信息为:按某属性A划分D,则该期望值为:属性A的信息增益值为:ID3采用信息增益。信息增益度量偏向于具有许多输出的测试,即偏向具有大量值的属性。增益率但若每个属性的元组个数为1,此时的信息增益无法对属性的划分提供有效信息。...原创 2019-01-10 11:58:01 · 1767 阅读 · 0 评论