数据分析
文章平均质量分 67
望月怀古
这个作者很懒,什么都没留下…
展开
-
第7章 航空公司客户价值分析
1 数据挖掘建模的目的借助航空公司客户数据,对客户进行分类。对不同的客户类别进行特征分析,比较不同类客户的客户价值。对不同价值的客户类别提供个性化服务,制定相应的营销策略。2 分析方法与过程2.1 分析方法 识别客户价值应用最广泛的模型是通过3个指标(最近消费时间间隔(Recency)、消费频率(Frequency)和消费金额(Monetary))来进行客户细分,识别出高价值客户,简称R原创 2017-10-21 10:00:45 · 2445 阅读 · 0 评论 -
第8章 中医证型关联规则挖掘
数据预处理 首先从数据集中读取数据。 1-6列分别进行聚类,然后分别存入新的DataFrame中。得到每一列的质心和聚类的个数。会与书中略有不同。 3.根据上面聚类的质心,替换表中的数据为类别。我采用的是cut方法。代码如下,不知道有没有更方便的:for r in range(6): cr = result.iloc[::2,:].ix[r] data_c.ix[:,r] = pd原创 2017-10-29 22:01:57 · 4856 阅读 · 1 评论 -
第6章 电力窃漏电用户自动识别
数据挖掘建模目的1.1 归纳出窃漏电用户的关键特征,构建窃漏电用户的识别模型。1.2 利用实时监测数据,调用窃漏电用户识别模型实现实时诊断。分析方法与过程 2.1 数据抽取 从营销系统、自动化设备及往年的窃漏电用户数据抽取数据。(实际上包含了自动抽取和人工标示两种方法)2.2 数据探索 初步分析的过程,可以说是技术选型阶段。而本案例中采用的是分布分析和周期性分析方法。2.2.1 分原创 2017-09-20 17:00:23 · 2094 阅读 · 0 评论 -
python数据分析与挖掘实战 第六章 拓展思考
企业偷漏税识别模型1、数据探索 偷漏税企业分布首先生成dataimport pandas as pdinputfile = r'E:\Download\百度云\图书配套数据、代码\chapter6\拓展思考\tax.xls'data = pd.read_excel(inputfile,index_col=0)通过以下代码获得各类销售模式中异常比率:t = pd.DataFrame(data原创 2017-10-14 15:13:28 · 2809 阅读 · 0 评论 -
python数据分析与挖掘实战 第七章 拓展思考
流失客户分类模型1 数据预处理如果动手做过的人可能面临的第一个问题就是,这数据读进pandas怎么弄编码结果都是错的。如果你存在这样的问题,那么我建议你使用NotePad++载入文件以后,改成无BOM的UTF-8编码,然后就可以正常读取了。数据预处理部分 根据书上的条件,预处理需要分以下几条: 1、老客户:飞行次数大于6次 2、已流失客户:第二年飞行次数’L1Y_Flight_Count原创 2017-10-24 17:00:28 · 2861 阅读 · 2 评论 -
第9章 基于水色图像的水质评价
背景与挖掘目标根据数码相机采集的水色照片对水质进行自动评价。我个人对这个评价中的采样过程是有意见的,如果对周围环境不做严格限制,数码相机采样得到的结果本身差异度就很大,用来做样本是不合理的。不过做为练习题,也就只能这样了。分析方法与过程对图像中心区域的抽取可以采用pillow库来完成。我编写了以下代码进行颜色矩的抽取。 首先,看一下我从网络上面下载的一张图,由于没有找到水质的图,所以找了一张细菌原创 2017-10-31 10:11:32 · 5018 阅读 · 3 评论 -
python数据分析与挖掘实战 第九章 拓展练习
这一章的拓展练习感觉是比较简单的。基本上没有太多让人纠结的地方。没有特征提取和数据规约,让事情简单了不少。当然不包括写出C4.5的决策树,我也没有那么写。读取数据,划分训练集和测试集,不用多说。 虽然题目要求的使用决策树,不过我依然使用了SVC做了一次。很巧合的是,同样也是要把train放大,我这里放大了30倍,但好像这不是我测试中效果最好的一次,不过就这一把,有兴趣各位可以再试。结果如下: 这原创 2017-11-06 16:29:55 · 2924 阅读 · 4 评论 -
第10章 家用电器用户行为分析与事件识别
本案例又是一个LM模型的应用。不过比较精彩的部分是时间序列数据的处理操作,进行的数据规约和特征提取部分。书中的代码除了贯序模型中一个错误外,其他并没有发现错误。不过因为本身对于时间序列的操作不是太熟悉,所以基本上就是跟着书中的代码走了一遍。挖掘目标 1.1 根据热水器采集到的数据,划分一次完整的用水事件。 1.2 在划分好的一次完整的用水事件中,识别出洗浴事件。分析方法和过程 2.1原创 2017-12-02 16:49:26 · 6186 阅读 · 1 评论 -
第12章 电子商务网站用户行为分析及服务推荐
八十几万条的数据,第一次让我感觉到了小笔记本是多么的不给力。个人想要学习大数据真是从开始就很难啊。磕磕碰碰总算把这一章中的主要代码全都弄出来了。下面就开始。为了避免在中间插入太多代码造成内容本身零落,所以代码请至我的个人博客中中自行下载。背景与挖掘目标推荐系统和搜索引擎的不同在于,推荐系统不需要用户提供明确的要求,而是通过分析用户的历史行为,从而主动想用户推荐能够满足他们兴趣和需求的信息。分析方原创 2017-11-24 22:45:13 · 8047 阅读 · 4 评论