自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Haoyu_xie的博客

准备转行数据分析的编程小白,努力在学习python中,把这里当做成长记录吧!

  • 博客(33)
  • 资源 (1)
  • 收藏
  • 关注

原创 “数”览十年黄金周:数据指标选择,与Python动态图表绘制

1. 数据是会骗人的,比起绝对数字,比率更适合作为数据指标2. 央视新闻报道中使用了炫酷的动态条形图,展现十年黄金周出行人数和旅游收入的变化,看着每年都在3. 增长,但是情况是否真的变好?4. 使用Python,计算年增长率,使用matplotlib和seaborn库,绘制超级炫酷的动态线形图

2020-10-04 10:54:08 546 1

原创 读书笔记-->《精益数据分析》第二部分 | 第15章:创业阶段4——营收

重心转变为:证明挣钱方式是可持续的。核心公式:客户收益回报-获客成本关注指标转变为投资回报,各种营收比率是“市场-产品契合”,而不是“产品-市场企业”。因而,是在进展不下去,寻找新的市场试试看。指标平衡,比只追寻指标增长重要。一、阶段指标与营收最大化1.1 阶段指标魔法数字:Ominture的乔希·詹姆斯提出,用营销费用的投资回报比来衡量SaaS公司的运转状况。指标计算方法:计算第X季度的再发性营收(QRR[X])计算第X季度的再发性季度营收(QRR[X-1])计算第.

2020-09-29 09:51:16 460

原创 读书笔记-->《精益数据分析》第二部分 | 第15章:创业阶段3——病毒性

阐述创业阶段中的病毒性传播说明阶段需要关注的关键指标点名此阶段发展的注意事项

2020-09-26 12:54:09 278

原创 读书笔记-->《精益数据分析》第二部分 | 第15章:创业阶段2——黏性

黏性是创业公司的可持续发展之道讲述产品黏性概念,关键指标最小可行话产品迭代注意事项此阶段功能开发“七问”,用户反馈分析“问题-解决方案画布”工具使用案例分析

2020-09-24 17:53:31 286

原创 读书笔记-->《精益数据分析》第二部分 | 第15章:创业阶段1——移情

创业的任何一个阶段,客户访谈都很重要:本文主要介绍移情阶段的主要工作及关键指标;介绍访谈、问题反馈评分、问卷调查等实操方法。

2020-09-24 00:00:09 1055

原创 读书笔记-->《精益数据分析》第二部分 | 第14章:创业阶段的划分

精益创业五大阶段排序了解公司所处阶段很重要不可盲目自信,不能掉以轻心

2020-09-21 12:19:24 284

原创 《精益数据分析》第二部分——第8-13章 | 读书笔记

介绍常见的六种商业模式;介绍模式运行的流程与关键指标;不仅能够指导创业,还能为数据分析工作提供正确思路。

2020-09-20 10:23:12 2341

原创 读书笔记-->《精益数据分析》第二部分:找到当前的正确指标 | 5-7章|数据分析框架、第一关键指标与商业领域

《精益数据分析》第二部分的5-7章。讲解重要的指标框架;详述第一关键指标的重要性与选取标准;简述指标与商业模式的关系。

2020-09-18 09:31:14 585

原创 读书笔记-->《精益数据分析》第一部分:别再欺骗自己了

1. 成功创业为什么需要数据分析?2. 数据分析基本概念——定性/定量数据、虚荣指标、相关性、同期群、细分、先见性指标。3. 数据分析中的风险。

2020-09-16 14:50:08 708

原创 Kaggle案例精选——电信客户流失预测(Telecom Customer Churn Prediction)Part Four:模型表现对比

上一part,构建了好多模型对数据集进行分类预测。这一趴将模型表现指标进行汇总和集中展示。

2020-09-15 10:08:42 2587 2

原创 Kaggle案例精选——电信客户流失预测(Telecom Customer Churn Prediction)Part Three:模型构建与可视化展现

终于进入建模的阶段。本趴主要使用各种模型来对数据进行训练和预测。数据选取技术包含过抽样计数、单变量特征选取;模型构建技术包含基本线性模型、决策树、随机森林、朴素贝叶斯、支持向量机、LightGBM和Xboost,以及相关指标可视化展现。

2020-09-15 08:56:16 4740 3

原创 Kaggle案例精选——电信客户流失预测(Telecom Customer Churn Prediction)Part Two:数据标准化;主成分分析机器可视化;相关分析与热力图;客户画像与雷达图

继续之前电信客户流失分析与预测的内容,第二趴。此趴主要是对数据进行标准化、相关分析、主成分分析和二元变量雷达图等可视化展现。比较重要的内容哦,雷达图真的很炫酷。

2020-09-14 11:19:01 2186 2

原创 Kaggle案例精选——电信客户流失预测(Telecom Customer Churn Prediction)Part One:数据说明;数据导入、处理;数据总览;描述性分析

数据集来自kaggle社区,电信客户流失数据分析与预测。此部分包括数据导入、简单处理、描述性统计分析等内容。设计饼图、柱状图、组合散点图和表格等的绘制技术。

2020-09-14 09:47:37 8001 3

原创 Chapter11-20:双样本假设检验、方差分析、线性回归、多元回归、非参数检验、统计质量控制、时间序列与预测、决策论简介

昨天将书本的每一章的思维导图图片单独发文,感觉太浪费发文次数。想了想,都放在一篇文章里,能一下子找到很多信息,方便大家连着看完。

2020-09-12 09:05:40 421

原创 Chapter10:单样本假设检验

2020-09-11 10:52:53 257

原创 Chapter9:估计与置信区间

2020-09-11 10:51:44 243

原创 Chapter8:抽样方法与中心极限定理

2020-09-11 10:50:52 336

原创 Chapter7:正态概率分布

2020-09-11 10:50:01 154

原创 Chapter6:离散概率分布

2020-09-11 10:48:59 119

原创 Chapter5:概率论概念纵览

2020-09-11 10:48:06 96

原创 Chapter4:其他描述性度量

2020-09-11 10:47:00 111

原创 Chapter3:描述数据:集中趋势度量

2020-09-11 10:45:56 825

原创 Chapter2:描述数据:频数分布和图形表示

2020-09-11 10:44:49 1255

原创 Chapter1: 什么是统计学?

2020-09-11 10:29:02 167

原创 《Python数据分析基础》学习记录004:绘制直方图出现报错AttributeError : ‘Rectangle’ object has no property ‘normed’

1 先贴出一个照着书本打的代码import numpy as npimport matplotlib.pyplot as pltplt.style.use('ggplot')mu1, mu2, sigma = 100, 130, 15x1 = mu1 + sigma*np.random.randn(10000)x2 = mu2 + sigma*np.random.randn(10000)fig = plt.figure()ax1 = fig.add_subplot(1, 1, 1)n,

2020-06-17 17:31:38 4424

原创 《Python数据分析基础》学习记录003:照着书里的代码敲,报错TypeError:‘int’ object is not iterable,总结一个异常处理方法

《Python数据分析基础》看到3.5.3,02中,用pandas实现的那段代码,就算照着打也一直报出TypeError的错误。最后解决啦,解决方法看正文啦。同时,也总结一下遇到报错的分析方法。

2020-06-10 13:44:53 1704 4

原创 《Python数据分析基础》学习记录002:2.4选取连续的行,pandas方法实现

1、数据描述及要求:详见文章末尾,需要练习的,直接复制,保存为csv文件。数据的前三行(1,2,3)和后三行(16,17,18)为不需要保存的数据。要求:丢弃这六行,在另外一个文件夹中保存中间的部分。2、pandas模块思路分析使用drop方法索引和丢弃不要的列。使用.iloc[ ]方法,用整数来索引行或者列。使用reindex方法,重新生成索引。用to_csv()保存需要保存的行问题:用不用reindex的差别是什么?3、涉及方法学习:1)pandas.DataFrame.dr

2020-06-06 11:51:09 434

原创 《Python数据分析》学习记录001:2.2.1 pandas筛选行中满足某个条件的值, ‘.astype(float)’花样报错!

书中第二章,2.2.1小节,用pandas模块筛选Supplier Name列中名字包含Z,或者Cost列中值大于600.0的所有列。csv文件中,Cost(成本列)的单位是美元,前面有一个美元符号‘$’,在excel中是货币形式,也就是大于千位的,会用‘,’进行分隔。所以,要想办法将Cost列的文本转化为浮点型数值才能跟600.0进行比较。问题也就出在这里,下面先列出问题:问题展示:按照书中给的代码,完整的敲下来是这样的:import pandas as pdfile1 = 'supplier

2020-06-05 09:01:16 846

原创 《Python数据分析基础》学习记录000:为什么已经安装了pandas包,但是用Python3.8的IDLE却import不了?

花了两天时间过完《Python数据分析基础》的第一章:Python基础,终于开始接触第一个数据分析模块pandas。不料,却在简单的import上遭遇滑铁卢。总结来看,主要遇到以下几个问题:在cmd窗口查到有pandas包,但是在IDLE中却import pandas却报错!比如这样:>>> import pandas as pdTraceback (most recent call last): File "<pyshell#0>", line 1, in

2020-06-04 22:48:53 3680

原创 Python中为什么(a, b = b, a + b)和 (a = b, b = a+b)不相同

赋值操作是将等号左边的值赋给右边的变量;Python在多值赋值的时候,等号右边如果有运算出现,那就先运算再赋值!这么说似乎说不清楚,点开文章看例子就知道了!

2020-05-20 10:31:01 1366

原创 Python的变量可以比喻为标签——这句话可以如何理解?

Python的变量可以比喻为标签——这句话可以如何理解?Python是一门灵活、易懂的语言,我想这点是大家公认的。半个月的学习,也让我对此深有感触。Python语言灵活性中,变量的灵活性功劳很大!Python的变量就像是贴在值上的标签,也可以说python的变量就是一个“嫁鸡随鸡、嫁狗随狗”的可怜小女人。。。ε=(´ο`*)))唉今天在群里帮小伙伴解释一个关于变量的问题,大家一起看看:>>> old = [1,2,3,4,5]>>> new = old&gt

2020-05-12 15:59:07 822

原创 聊一聊Python中,if与elif的那些事儿

聊一聊Python中,if与elif的那些事儿作为新手,还真是时常会忘记适用 elif 这个好用的判断方法。或者干脆不知道什么时候适用 elif。关于 if 与 elif,以下两个问题可能是大家比较关心的:只用 if 进行判断和 if 与 elif 一起搭配判断,有什么区别?elif的适用情况有哪些?话不多说来看例子:在学习群里看到有个网友抛出这样一段代码,先来猜猜最终会打印什么?x = -10y = 1if x<20: y += 1elif x<10:

2020-05-12 07:35:17 1749

原创 Python3求100-1000之间的水仙花数

什么是水仙花数?水仙花数,是指这个数字每一位上的数字的立方之和等于这个数。比如,153 = 1^3 + 5^3 + 3^3 ,那么153就是一个水仙花数。思路:可以分别求出某个数 i 每一位上的数字,求各个位数的立方之和sum,判断sum与 i 是否相等。实现练手的时候想到的import mathfor i in range(100, 1000): hund...

2020-04-29 10:02:29 2660 2

workbook.rar

实现代码需要的三个excel表格。下载资源之后,还需要更改代码中的input_file部分,改为您自己的文件储存路径。

2020-06-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除