自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)
  • 收藏
  • 关注

原创 Python科学计算库-NumPy

这里写目录标题1 NumPy认知2 NumPy的Ndarray对象2.1 一维数组的创建2.2 二维数组的创建2.3 常用属性2.4 修改数组的形状2.5 将数组转化成list2.6 数组的索引和切片2.7 数组中的数值修改3 数组中的轴4 数组的计算5 数组的操作5.1数组的添加/删除/去重5.2 数组的拼接5.3 数据的分割6 数组的空值nan和无穷大inf7 二维数组的转置1 NumPy认知效率对比2 NumPy的Ndarray对象知识点:2.1 一维数组的创建2.1.1 直接传

2021-09-13 22:32:43 260

原创 python科学计算库-Matplotlib

这里写目录标题1 认识Matplotlib2 常见的图形种类和意义3 Matplotlib画图的简单实现4 Matplotlib图像结构5 折线图6 散点图7 条形图8 直方图9 饼图1 认识Matplotlib什么是Matplotlib?Matplotlib是一个Python 2D绘图库几行代码即可生成绘图,直方图,条形图,散点图等.为什么要学习Matplotlib?可视化是在整个数据分析的关键辅助工具,可以清晰的理解数据,从而调整我们的分析方法.能将数据进行可视化,更直观的呈现使数据更加

2021-09-12 22:28:47 302

原创 Python知识--爬虫

爬虫知识点1 爬虫的基本认知2 网页基本认知3 网页构成4 XPath的基本使用1 爬虫的基本认知**爬虫定义:**请求网站并提取数据的自动化程序爬虫的基本流程:1> 发起请求:发送一个Request2>获取响应内容:得到一个Response,即要获取的页面内容3>解析内容:用正则表达式,网页解析库进行解析4>保存数据:可以存为文本,存到数据库,或者特定格式的文件爬虫的工作原理2 网页基本认知浏览器工作原理:浏览器发送消息给该网址所在的服务器,这个过程叫做HTT

2021-08-29 20:12:20 245 2

原创 Python基础知识-模块

模块**模块:**一个.py文件就是一个模块,模块是管理功能代码的**自定义模块:**根据业务需要,自行创建**内置模块:**python内部自带的不需要下载的模块函数<类<模块os模块 random模块 math模块 time模块**math模块作用:**提供了许多对浮点数的数学运算函数查看math模块中的内容:import mathdir(math)time 模块作用:处理日期和事件time.time() 返回当前时间的时间戳time.sleep(secs)

2021-08-29 18:37:11 121

原创 Python基础知识--函数和面向对象答疑直播笔记

拓展知识点:拓展点:随机数习题1:盲盒奖品–知识点:函数,随机数,返回值任务描述: 某比赛共设三个奖项,分别是:一等奖、二等奖、三等奖,一等奖的奖品有三种选择:电饭煲、空调、洗衣机,二等奖的奖品有三种选择:球鞋、手表、滑板,三等奖的奖品有三种选择:对联、手袋、钙片,现需要编写一个函数,函数中设置一个参数,该参数用来接收对应奖项的字符串,即:如果参数值等于‘一等奖’,则返回对应奖项下可选择奖品的任意一个,从而实现盲盒抽取效果。如果参数值的字符串不是一等奖、二等奖或者三等奖,则直接返回没有该

2021-08-29 18:15:59 188

原创 Python函数案例分享和答疑---第四次直播笔记

课后练习1:学生的成绩任务描述: 张三、李四、王五、赵六、王麻子、二混子六位同学一同参加期末考试,考试结果如下: 分数根据姓名依次排列。语文:95,89,79,90,77,25数学:95, 90, 44, 77, 77, 89补充:双层for循环知识点:补充:课后练习2课后练习3:医生的排号方法1:课后练习4:歌词的处理补充排序sorted匿名函数:#方便我们写一些简单的函数,不需要写函数名,不需要写return#lambda 参数1

2021-08-29 16:25:14 163

原创 Python基础知识--函数

Python基础知识--函数**1 函数的简介**2 函数的定义和调用3 函数的参数4 函数的返回值5、递归函数1 函数的简介**函数:**程序中,将需要多次使用的代码块组织为一个小模块,叫做函数.**函数的作用:**可以提高编写的效率以及代码的重用函数的类型:python内建函数,如:input(),type()用户自定义函数示例:2 函数的定义和调用函数必须先定义,后调用定义函数的格式:调用函数时,函数从头执行,代码执行完毕,调用结束若函数中有return语句,执行到re

2021-08-28 21:02:21 164

原创 Pythton基础知识--集合

集合 set集合:一个无序的不重复元素的序列集合的创建:使用大括号{}或者set()函数创建集合注意:集合不支持下标赋值和取值定义空的集合的时候不能直接使用{}示例:集合不能使用下标索引用add添加元素用集合去重列表...

2021-08-28 18:14:51 152

原创 Python基础知识--字典

字典 dict字典:可变容器模型,且可存储任意类型对象字典格式:每个键值对用冒号分割,每个对之间用逗号分割,整个字典包括在{}中注意:一个Key只能对应一个value字典的常见操作示例:字典的修改输入key值和values值...

2021-08-28 17:10:09 60

原创 Python基础知识-元组

**元组 tuple**元组:Python另一种有序列表,元组不能修改元组的格式:写在圆括号之间,用逗号隔开注意:tuple不可变,没有append(),extend(),insert()等其他获取元素的方法和list是一样示例:元组可以存放列表元组只有一个元素时,需要在后面加个逗号元组的长度元组中列表查看和修改...

2021-08-28 17:04:12 69

原创 Python基础知识-列表

列表list列表:Python内置的一种数据类型,是一种有序的集合列表的格式:写在方括号之间,用逗号隔开注意:列表中的元素可以是不同类型的列表常见操作列表遍历示例:列表的索引列表的切片append、extend和insertappendextendinsert删除:delpop 输出最后的元素removedel 删除了整个列表clear 清空列表查看某个元素是否在列表中列表的遍历列表元素的替换...

2021-08-28 16:56:26 59

原创 Python基础--字符串

**1、字符串**字符串:单引号、双引号、包括三引号包围的字符组例如:下标和切片下标索引:即编号,我们可以根据下标找到对应的元素切片:对操作对象截取其中一部分的操作切片语法:[起始:结束:步长] 支持负数字符串常见操作示例单引号,双引号和三引号下标索引和切片常用方法...

2021-08-28 16:38:37 65

原创 Python 学习案例及答案

案例1 公交车有多少人案例描述:一辆公交车线路全长一共有7站,初始站车上没有乘客,第一站只有上车乘客,没有下车乘客,从第二站开始,陆续上车和下车,到最后一站全部下车,我们需要统计车上乘客数,若下车人数大于车上人数,提示错误,终止循环。参考答案如下:people = 0for i in range(7):print(‘当前在第{}站’.format(i+1))a = int(input(‘上车人数:’))b = int(input(‘下车人数:’))if i == 0:people = a

2021-08-28 16:16:39 880

原创 Python基础知识-while/for/break/continue语句

循环:while语句循环:for循环 示例:for循环for循环求和for 与 while 语句等同range 函数break 语句 --结束整个循环continue语句 结束当次循环,直接进入下一次

2021-08-28 13:55:04 87

原创 层次分析法《供应商选择》

案例背景:1、建立层次结构模型数据为1手数据,需要自己去收集2、构造对比较矩阵分数为0~9,比如2,产品架构比系统集成性稍强。

2020-09-22 06:52:02 2183

原创 《EXCEL教科书》学习笔记(持续更新)

《EXCEL教科书》学习笔记(持续更新)*重要快捷键一览表Ctrl + 1 > 打开‘设置单元格式’Ctrl +S > 保存Ctrl +Z > 撤销Ctrl +F > 查找Ctrl +H >替换Crtl +Enter >一并输入多个单元格Ctrl + D> 复制上一个单元格的内容Ctrl +R > 复制左边单元格的内容F4 > 设置公式的绝对引用Ctrl +F2 >打印预览Ctrl +F11>添加工作表Alt +

2020-09-21 21:01:22 215

原创 多类别关联规则案例《刑事案件》

一般关联规则都是应用于二分类,但是对于多类别是否可以用关联规则呢?答案是可以的,操作就是将多类别转化为二分类,即独热编码处理。处理后,再进行关联分析。原始数据:将文字转化为数字类别独热编码处理(将多分类处理为二分类)将多分类转化为二分类后,进行关联分析结果输出损失程度和作案人数为3人是关联的。...

2020-09-15 21:15:51 396

原创 简单对应分析案例《好评数据分析》

对应分析:仅能分析类别型变量的两两对应关系。

2020-09-14 07:01:00 1762

原创 Apriori算法案例《超市购物篮关联分析》

**Apriori 算法关键概念**01 项集 :在关联分析中,包括0个或多个项的集合被称为项集。如{啤酒,尿布,牛奶,花生}是一个4项集。02支持度: 一个项集或者规则在所有事物中出现的频率,确定规则可以用于给定数据集的频繁程度。03置信度: 确定Y在包含X的事物中出现的频繁程度。简单说,可信度就是指在出现了物品集X的事物T中,物品集Y也同时出现的概率有多大。04期望置信度: 期望可信度描述了在没有任何条件的影响时,物品集B在所有事物中出现的概率有多大。05提升度: 提示度是可信度与期望可信

2020-09-12 08:58:50 4501 6

原创 PSM案例《价格敏感度分析》

价格敏感度测试PSM在新产品开发时,企业为了获得消费者对产品价格的接受区间,会进行价格敏感度测试。它不需要预先给定好价格,而是让每位受访者表示他们的可接受价格范围。针对指定价格区间的每个价格,测试人员通常会有针对的提出四个测试问题,受访者需要从高到低再问卷相应的地方选择适当的价格数据。受访者在试用新产品后,被要求回答以下四个问题:什么价格觉得太便宜,什么价格觉得较便宜,什么价格觉得较贵,什么价格觉得太贵。调查的原始数据整理如下:数据分析如下:1、数据预处理觉得20元太便宜的人,肯定认为0元也

2020-09-09 20:12:45 5055

原创 KANO模型案例《产品功能上市前调研分析》

案例背景:某公司进行电脑新产品开发,经过定性研究搜集到4种主要市场需求,分别记为速度快、存储空间大、防水、外形新颖,请用kano模型对该组需求进行功能属性研究。要求:(1)请针对某一功能属性设计调查问题。(2)请写出kano分析的典型属性分类表,请使用M表示必备属性,O表示期望属性,表示A魅力属性,表示I无差异属性,表示R厌恶属性,表示Q可疑答案。(3)假设对200名目标客户群体,进行问卷调查,回收有效问卷168份,得到如下功能评价结果,请对下述四种功能进行属性分类。(4)请针对(3)中目标客户

2020-09-08 21:42:59 1402

原创 支持向量机SVM预测案例《游戏用户付费分析》

案例背景本案自变量取用户ID,安装时间,最后登录时间,游戏等级,手机系统,在线天数,平均在线时长,持续时间(最后登录时间-安装时间),是否付费为因变量,来预测游戏用户是否付费。数据资源数据分析步骤1、数据预处理游戏等级的异常值较多,此案例不做处理。相关性较高,但是二分类预测对相关性要求不高。不像聚类要求那么严苛。2、模型选择:支持向量机模型参数如下训练集结果测试集泛化误差较小,模型可用。...

2020-09-07 21:46:47 731 1

原创 逻辑回归分类预测案例《电信流失客户分析》

【案例背景】本案例收集了某电信行业客户数据,主要包含:在网月数、年龄、婚姻状况、现地址居住时间、教育程度、工作状态、性别、租设备、IP电话、无线电话、本月话费、语音信箱、网络、来电显示、呼叫等待、呼叫转移、流失状态等字段数据,一共600条数据。数据源介绍数据源中在网月数是到数据收集时间为止的在网月数。这里用户流失状态判断是根据用户在近2个月是否还在使用手机号码为准。【分析目的】根据数据分学习客户特征,并根据客户的这些特征对客户是否会流失进行预测。数据分析步骤:数据预处理1、描述性统计分析:

2020-09-06 15:35:41 1238

原创 K-Mean 聚类分析《移动用户细分》

【案例背景】随着经济和信息发展,以及通信行业内部竞争加剧,传统的单一品种的套餐和服务已经不能够满足客户日益增长的个性化需求,为了更好地服务和保留客,移动想要根据用户平时通话行为为客户推荐个性化套餐服务,加强用户满意度体验,减少客户流失。数据资源【分析目的】根据这些客户数据,结合用户通话行为,对客户进行细分,推荐相应套餐,或者结合用户现有套餐优化用户套餐,提供个性化套餐。数据分析步骤数据预处理描述性统计分析缺失值处理异常值处理相关性检验标准化处理1、描述性统计2、异常值处理

2020-09-06 15:32:16 1748 2

原创 分类预测案例《电信流失客户分析》

【案例背景】本案例收集了某电信行业客户数据,主要包含:在网月数、年龄、婚姻状况、现地址居住时间、教育程度、工作状态、性别、租设备、IP电话、无线电话、本月话费、语音信箱、网络、来电显示、呼叫等待、呼叫转移、流失状态等字段数据,一共600条数据。数据源介绍数据源中在网月数是到数据收集时间为止的在网月数。这里用户流失状态判断是根据用户在近2个月是否还在使用手机号码为准。【分析目的】根据数据分学习客户特征,并根据客户的这些特征对客户是否会流失进行预测。数据分析步骤:数据预处理1、描述性统计分析:

2020-09-06 11:11:41 1180

原创 RFM电商客户分析

在RFM模式中,R(Recency)表示客户最近一次购买的时间有多远,F(Frequency)表示客户在最近一段时间内购买的次数,M (Monetary)表示客户在最近一段时间内购买的金额。一般的分析型CRM着重在对于客户贡献度的分析,RFM则强调以客户的行为来区分客户。一、RFM模型的建立RFM模型使用的三个指标是近度(Recency)、频度(Frequency)、值度(Monetary)。以RFM模型为基础,通过客户的RFM行为特征衡量分析客户忠诚度与客户内在价值。二、数据筛选分组为了得到客户最

2020-09-05 14:14:35 2064

原创 机器学习之决策树算法原理

决策树介绍决策树算法是一种逼近离散函数值的方法。它是一种典型的分类方法,最早产生于上世纪60/70年代,由J Ross Quinlan提出了ID3算法和C4.5算法。C4.5算法在ID3算法的基础上进行了改进,对与预测变量的缺值处理,剪枝技术,派生规则等方面做了较大的改进,既适合于分类问题,又适用于回归问题。决策树原理:信息增益、信息增益率与基尼系数决策树原理-ID3决策树原理-C4.5决策树原理-基尼系数...

2020-09-02 19:39:59 377

原创 机器学习之二分类逻辑回归案例:《鸢尾花数据》

二分类逻辑回归:前面两篇文章针对的是自变量为连续型的,若针对自变量为类别型,线性回归便不再适用。二分类预测适用场景:选举,中奖,比赛输赢,健康与否,行业未来等。分类器预测思路:将带有结果的样本分为训练集和测试集,进行机器学习。训练集用于计算模型,测试集检验模型的准确率。训练集和测试集参数均通过后,可用于预测模型。《鸢尾花预测》案例样本数据如下:共有九十个样本。目的为通过萼片长/宽/花瓣长/宽来预测是否为鸢尾花。1)打开datahoop平台,上传数据,选择逻辑回归模型2)确定自变量和因变

2020-09-01 23:24:50 3105

原创 多元线性回归案例:《银行不良贷款分析》

业务理解不良贷款对银行利益的侵蚀效应不仅仅体现在利润和收入上,在市场营销、新设备投入、社会声誉等方面都会受到影响。因为创收能力的下滑,在经营管理各方面的费用投入不如之前了,想要在商务区开的新网点开不成了、想要购置的新科技设备也泡汤了,在同业面前,不得不面对综合竞争力的下降。同时,一家支行如果不良贷款过高,会让社会公众对该行的盈利能力和风险控制能力产生质疑,觉得在这家银行办业务不保险,民众的业务需求会转而投向其他银行,社会声誉受到损失不说,客户和业务也会流失不少。原始数据多元线性回归步骤业务目的为预

2020-08-31 22:12:28 7007 2

原创 CPDA案例:基于EXCEL的一元线性回归案例《广告与销量》

基于EXCEL的一元线性回归案例:广告与销量基于EXCEL的一元线性回归案例:广告与销量业务分析一元线性回归步骤业务解读基于EXCEL的一元线性回归案例:广告与销量一元线性回归是分析只有一个自变量(自变量x和因变量y)线性相关关系的方法。一个经济指标的数值往往受许多因素影响,若其中只有一个因素是主要的,起决定性作用,则可用一元线性回归进行预测分析。业务分析数据如下图所示,需要分析广告费用对销售收入的影响。一元线性回归步骤1、选择模型:在EXCEL的数据分析中选择回归。2、确定自变量和因变量

2020-08-31 00:16:05 1033

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除