自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 机器学习--决策树

文章目录知识要点信息熵决策树原理决策树概念训练决策树预测原理分类决策树信息增益知识要点信息熵(1)概念信息熵,在1948年由香农提出。用来描述系统信息量的不确定度。不确定性越大,则信息熵越大,反之,信息熵越小。(2)计算方式假设随机变量X具有m个值,分别为:V1,V2,...,VmV_1,V_2,...,V_mV1​,V2​,...,Vm​且P(X=V1)=p1P(X=V_1)= ...

2020-06-01 22:51:10 583

原创 航空公司客户价值挖掘与分析

文章目录一、项目背景二、数据分析1.数据清洗2.数据处理3.数据建模4.模型总结一、项目背景客户关系管理是信息时代的企业核心问题。客户关系管理的关键在于客户分类用以区分无价值客户、高价值客户用以区分无价值客户、高价值客户针对不同价值的客户制定个性化服务方案通过建立客户价值评估模型对客户进行分群制定相应营销策略。某航空公司积累了大量的会员信息档案和其航班记录,根据这些数据,实现以下目标:1.根据航空公司客户数据,对客户进行分类2.对不同的客户类别进行特征分析,比较不同类客户的价

2020-05-13 18:03:43 1167

原创 通过线性回归模型及优化实现AQI分析与预测

1 项目背景与分析说明1.1 项目背景AQI(Air Quality Index),指空气指数,用来衡量空气清洁或污染的程度,值越小,表示空气质量越好。由于空气污染问题,近年来空气质量越来越受人们的重视。1.2 数据说明本数据集总记录了全国主要地区城市共325地,使用的字段有12列包括:· City:城市名· AQI:空气质量指数· Precipitation:降雨量· GDP:城...

2020-04-24 17:36:07 8520 11

原创 Python 淘宝1225万交易行为数据分析实践

项目背景基于淘宝平台数据,通过相关指标对用户行为进行分析,探究用户的交易行为模式。数据及字段说明本文使用的数据集来自天池的公开数据:天池-淘宝交易行为数据集本文使用的数据集时间段为2014.11.18-2014.12.18,包含了淘宝移动端的用户行为数据,总计12256906条数据,共6列。user_id:item_id:behavior_type:user_geoshash:...

2020-04-09 21:34:19 592 1

原创 数据分析相关积累 业务方面面试题思考及整理

1.业务思维1.不用任何公开参考资料,估算今年新生儿出生数量。采用两层模型(人群画像x人群转化):新生儿出生数=Σ各年龄层育龄女性数量*各年龄层生育比率 一般可参考费米估计问题 从时间序列上分析:如果有前几年新生儿出生数据,建立时间序列模型进行预测(同时应该考虑一些重要影响因素,如开放二胎政策等) 寻找相关先兆指标:如婴儿类产品的新增活跃用户数量X,潜在新生儿家庭用户n。X/...

2020-04-08 11:08:20 1813 1

原创 关于MySQL索引及InnoDB与MyISAM引擎的区别的学习笔记

1.索引·对表中一列或多列的值进行排序·定义一种存储结构·快速检索到数据·存储引擎级实现,不同存储引擎实现索引的机制是不一样的2.索引类型·普通索引:基本索引类型,没什么限制,允许重复值和空值·唯一索引:索引列的值必须是唯一的,但允许空值·主键索引:不允许有空值的唯一索引·组合索引:多个字段组合上创建索引,最左原则,只有查询条件中使用了这些字段的最左边字段shift,索引才会被使...

2020-03-12 17:09:58 98 1

原创 Python练习 -- 通过电影票房数据统计不同类型的票房总数

Python练习 – 对单元格进行拆分并保留其他行数据1.需求从一份电影票房数据中按照电影类型分类,统计出不同类型的票房总数2.数据处理在前期的数据处理中需要将各个电影类型进行拆分,通过以下python代码实现data = pd.read_csv('movie_metadata.csv')data_new = data.drop(['genres'], axis=1).join(d...

2020-03-10 00:52:44 2713 5

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除