自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 python数据分析与挖掘实战---chapter10家用电器用户行为分析与事件识别

1. 项目背景与挖掘目标1.1 背景居民在使用家用电器过程中,会因地区气候、不同区域、用户年龄性别差异,形成不同的使用习惯。家电企业若能深入了解不同用户群的使用习惯,开发新功能,就能开拓新市场。要了解用户使用家用电器的习惯,必须采集用户使用电器的相关数据下面以热水器为例,分析用户的使用行为。在热水器用户行为分析过程中,用水事件识别是最关键的环节。比如,国内某热水器生产厂商新研发的一种高端智能热水器,在状态发生改变或者有水流状态时,会采集各监控指标数据。该厂商根据其采集的用户的用水数据,分析用户的用水行

2020-09-14 15:18:25 2066 1

原创 python数据分析与挖掘实战---chapter8中医证型关联规则挖掘

1. 项目背景恶性肿瘤俗称癌症,当前已成为危害我国居民生命健康的主要杀手。应用中医药治疗恶性肿瘤已成为公认的综合治疗方法之一,且中医药治疗乳腺癌有着广泛的适应证和独特的优势。从整体出发,调整机体气血、阴阳、脏腑功能的平衡,根据不同的临床证候进行辨证论治。确定“先证而治”的方向:即后续证侯尚未出现之前,需要截断恶化病情的哪些后续证侯。发现中医症状间的关联关系和诸多症状间的规律性,并且依据规则分析病因、预测病情发展以及为未来临床诊治提供有效借鉴。这样,在治疗患者的过程中,医生可以有效地减少西医治疗的毒副作用,

2020-09-12 18:21:31 3317

原创 python数据分析与挖掘实战---chapter7航空公司客户价值分析

1. 背景与挖掘目标1.1 背景企业营销焦点从产品中心转变为客户中心,客户关系管理成为企业的核心问题客户关系管理的关键问题是客户分类,通过客户分类,针对不同价值的客户制定优化的个性化服务方案,采取不同营销策略1.2 目标借助航空公司客户数据,对客户进行分类。对不同的客户类别进行特征分析,比较不同类客户的客户价值。对不同价值的客户类别提供个性化服务,制定相应的营销策略。2. 分析方法与过程本案例的目标是客户价值识别。识别客户价值应用最广泛的模型是通过3个指标(最近消费时间间隔(R

2020-09-11 19:34:00 3253 2

原创 python数据分析与挖掘实战---5.1.4 决策树:ID3算法

ID3算法简介及基本原理ID3算法基于信息嫡来选择最佳测试属性。它选择当前样本集中具有最大信息增益值的属性作为测试属性;样本集的划分则依据测试属性的取值进行,测试属性有多少不同取值就将样本集划分为多少子样本集,同时决策树上相应于该样本集的节点长出新的叶子节点。ID3算法根据信息论理论,采用划分后样本集的不确定性作为衡量划分好坏的标准,用信息增益值度量不确定性:信息增益值越大,不确定性越小。因此,ID3算法在每个非叶节点选择信息增益最大的属性作为测试属性,这样可以得到当前情况下最纯的拆分,从而得到较小的决策

2020-09-09 18:21:46 1696

原创 python数据分析与挖掘实战---拉格朗日插值法

拉格朗日插值法定义对某个多项式函数,已知有给定的k + 1个取值点:其中Xj对应着自变量的位置,而Yj对应着函数在这个位置的取值。假设任意两个不同的xj都互不相同,那么应用拉格朗日插值公式所得到的拉格朗日插值多项式为:其中每个为拉格朗日基本多项式(或称插值基函数),其表达式为:拉格朗日基本多项式的特点是在Xj上取值为1,在其它的点Xi,i≠j上取值为0。范例假设有某个二次多项式函数{\displaystyle f}f,已知它在三个点上的取值为:要求 f(18) 的值。首先

2020-09-09 15:08:48 1289

原创 CD用户消费数据分析

项目来自网络附数据集1.数据载入和探索1.1 数据加载import numpy as npimport pandas as pd%matplotlib inlineimport matplotlib.pyplot as pltdf = pd.read_csv('./CDNOW_master.csv', names = ['user_id', 'order_dt', 'order_products', 'order_amount'], sep='\s+')df.head()use

2020-09-08 20:38:50 835

原创 奥运会数据集分析

项目来自和鲸社区奥运会数据集分析目录项目来自和鲸社区[奥运会数据集分析](https://www.kesci.com/home/project/5b6912bc9889570010c244f3)1. 数据载入与总览1.1 数据加载1.2 数据总览2. 奥运会运动项目词云3. 查看参赛者的男女基本信息3.1. 120年来参赛者的男女比例3.2. 查看参赛者的男性与女性的年龄分布3.3. 查看1896-2014年男女参赛者的平均年龄变化3.4. 查看120年来????夏季????奥运会获奖运动员不同性别的平均

2020-09-08 16:19:02 6665 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除