自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 资源 (2)
  • 收藏
  • 关注

原创 数据分析师-机器学习之贝叶斯

数据分析师-机器学习之贝叶斯贝叶斯网络贝叶斯算法是有监督的学习算法,解决的是二分类和多分类问题。经典统计学与贝叶斯统计学经典统计学:总体信息:当前样本符合某种分布。比如抛硬币,二项分布,学生的某一科成绩符合正态分布。样本信息:通过抽样得到的部分样本的某种分布。抽样信息=总体信息+样本信息。基于抽样信息进行统计推断的理论和方法称为经典统计学。贝叶斯统计学:先验信息:抽样之前,有关推断问题中未知参数的一些信息,通常来自于经验或历史资料。基于总体信息+样本信息+先验信息进行统计推断的方法和理

2020-12-29 14:58:16 753

原创 数据分析师-机器学习之线性回归

数据分析师-机器学习之线性回归回归分析:回归:统计学分析数据的方法,目的在于了解两个或多个变量间是否相关、研究其相关方向与强度,并建立数学模型以便观察特定变量来预测研究者感兴趣的变量,回归分析可以帮助人们了解在自变量变化时因变量的变化量。一般来说,通过回归分析我们可以由给出的自变量估计因变量的条件期望。误差分布:真实值和预测值之间的差异:误差分布特点 (独立、同分布、 高斯分布)。线性回归的最小二乘法:在这里插入代码片最小二乘法回归存在问题:矩阵必须可逆。当特征数较多时,求逆运算

2020-12-10 16:13:15 387

原创 数据分析师-机器学习之聚类算法DBSCAN

机器学习之聚类算法DBSCAN1.DBSCAN是一个比较有代表性的基于密度的聚类算法。与划分和层次聚类方法不同,它将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在噪声的空间数据库中发现任意形状的聚类。DBSCAN密度聚类思想:由密度可达关系导出的最大密度相连的样本集合,即为我们最终聚类的一个类别,或者说一个簇。DBSCAN中的几个定义:1.Ε邻域:给定对象半径为Ε内的区域称为该对象的Ε邻域;2.核心对象:如果给定对象Ε邻域内的样本点数大于等于MinPts,则称该对象为

2020-12-07 21:16:49 852 1

原创 数据分析师-机器学习之决策树算法

机器学习之决策树算法决策树(decision tree)是一种基本的分类与回归方法,决策树由结点(node)和有向边(directed edge)组成,结点类型:根结点(root node),内部结点(internal node)和叶结点(leaf node)。决策树的构建:(ID3、C4.5和CART)一.特征选择1.特征选择在于选取对训练数据具有分类能力的特征2.特征选择的标准是信息增益(information gain)二.决策树的生成计算信息增益:1.香农熵:计算所有类别所有可能

2020-12-07 21:16:36 216

原创 数据分析师-机器学习之聚类算法K-Means

机器学习之聚类算法1.k-Means算法K-均值(K-Means):K均值法是麦奎因(MacQueen,1967)提出的,这种算法的基本思想是将每一个样品分配给最近中心(均值)的类中。算法步骤:1.先从没有标签的元素集合A中随机取k个元素作为k个子集各自的中心2.分别计算剩下的元素到k个子集中心的距离,将这些元素分别划归到最近的子集3.根据聚类结果,重新计算中心(子集中所有元素各个维度的算数平均数)4.将集合A中全部元素按照新的中心然后再重新聚类5.重复以上步骤,直到聚类的结果不再发生变化

2020-12-07 21:16:22 315

原创 数据分析师-机器学习之knn

机器学习之knnknnK最近邻(kNN,k-Nearest Neighbor): k近邻法(k-nearest neighbor, k-NN)是1967年提出的一种基本分类与回归方法。K最近邻分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是k个最近的邻居的意思,每个样本都可以用它最接近的k个邻居来代表。kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。工作原理:存在一个样本数据集合,也称作

2020-12-07 21:16:02 234

原创 Numpy之数据清洗功能

numpy之数据清洗功能numpy之数据清洗功能numpy的简介numpy的数组numpy的属性numpy的变换numpy的合并切割numpy的广播功能numpy的统计函数numpy的字符串函数numpy的排序函数numpy的矩阵函数numpy的线代模块1. Numpy的简介1.1Numpy的简介NumPy 是 Numerical Python 的简称,是高性能计算和数据分析的基础包。包

2020-11-25 15:38:52 1392

原创 Python中的流程控制语句(5个)

Python中的流程控制语句(5个)if条件判断if嵌套while循环for循环跳转语句1.if条件判断1.1 if语句if 条件:条件为真(True)执行操作判断密码输入情况a="123456"password=input(“请输入您的密码:”)if a=password:print(“密码正确”)1.2 if-else语句if 条件:条件为真(True)执行操作else:条件为假(False)执行操作判断是否为成年.

2020-11-20 16:49:57 540

原创 Python中的基本数据类型(7个)

1.布尔型布尔型数据的算术运算 布尔型的取值只有两个,True 和 False。可以拿来做算术运算,此时等价于 1 和 0。布尔型数据的逻辑运算计算优先级:先算not ,再算and, 最后算or。下列中 a = 10, b =202.数值型2.1整数型Python中的整型属于int类型,默认用十进制表示,此外,也支持二进制,八进制,十六进制表示方法。进制转换计算机本质上只认识二进制,但是python里面的数字还是以十进制展示的, 当然里面给我们内置了一些方法帮我们把转换为其他进制。bin

2020-11-19 17:27:08 9426 1

原创 预测性分析及常用预测方法

预测性分析及常用的预测方法预测的目的数据分析最重要的目的就是从数据中寻找规律,找到能够指导我们未来实践的原则和方法,是产生智慧的主要途径。所以预测分析是数据分析的终极目的。虽然数据分析承担了很多功能,但是预测才是最为关键的,所以掌握数据分析和挖掘的预测方法才是数据分析师的看家本领。预测包括现象的预测和规律的预测。自然科学的本质上也是对事物的属性、本质和规律的预测。有了对事物的认知和对规律的掌握,我们就能够创造出更多的东西。商业也是如此,我们能够知道影响销售的因素,并能够掌握这些因素的数据,就能够对市场

2020-11-06 14:43:18 21171

原创 Excel动态图表——滑动箭头图

Excel动态图表——滑动箭头图1.首先准备好数据,确定自己的需求。2.插入滑动控件,选择单元格连接位置。3.创建名称管理器。新建名称管理器=>>引用位置写上函数=OFFSET(滑动箭头图!$A$2,,,1,滑动箭头图! $A$5)函数解释:从(滑动箭头图! $A$2)开始进行选择,行列不进行偏移,选取(1)行(滑动箭头图! $A$5单元格显示的值)列。滑动箭头图! $A$2 (是数据表格的初始位置)滑动箭头图! $A$5(是滑动控件的单元格连接引用位置)4.插入条形图

2020-10-30 16:37:09 1583

原创 数据分析师应会技能(Excel)(高级)

1.数组的运用数组就是单元的集合或是一组处理的值集合。可以写一个以数组为参数的公式,即数组公式,就能通过这个单一的公式,执行多个输入的操作并产生多个结果——每个结果显示在一个单元中。两个数组的行数取最大值,列数取最大值,即为结果的行列数。数组的表示:用花括号{}表示数组。如{10,20,30;40,50,60}。其中,30后面,跟的是分号;,表示40要换行了。数组的各个元素间用逗号与分号分隔,两者意义一定要理解,分号分隔表示的是数组的行分隔。数组公式可以认为是Excel对公式和数组的一种扩充,换一句话

2020-10-28 14:11:19 1083

原创 数据分析师应会技能(Excel)(中级)

数据分析师应会技能一(Excel)(中级)1.熟悉数据透视数据透视表作为EXCEL最核心的一个功能组件,也是学习数据分析门槛最低的一种途径,数据透视表是一种交互式的表,可以进行某些计算,如合并汇总表、处理不规范数据、制作动态交互图表、代替复杂公式等。所进行的计算与数据跟数据透视表中的排列有关。所以学好数据透视表是数据分析的一个基础。数据透视表是一种可以快速汇总大量数据的交互式报表,总结信息的分析工具,快速比较统计数据,综合了Excel中数据排序、筛选、分类汇总和数据分析的优点,可以方便的调整布局、

2020-10-28 13:33:48 909

原创 数据分析师应会技能(Excel)(初级)

数据分析师应会技能(EXCEL)(初级)

2020-10-28 11:18:05 975

原创 会员分析之家庭会员

家庭会员 一般情况下,会员制组织是企业、机构及非盈利组织维系其客户的结果。他通过提供一系列的利益来吸引客户自愿加入,这一系列的利益称为客户忠诚度计划。而加入会员制组织的客户称为会员,会员制组织与会员之间的关系通过会员卡来体现,会员卡是会员进行消费时享受优惠政策或特殊待遇的“身份证”。 现在市面上的会员主要分为两部分;一部分为充值型会员,客户需要向商家存储一定资金来获得该品牌该企业的会员,享受会员服务(这种会员多见于餐饮休闲娱乐类)。另一部分为打折类会员,客户通过一定消费或者通...

2020-06-16 10:33:59 1731

原创 大数据下的供应商评分系统

大数据下的供应商评分系统Supplier scoring system under big data摘要现在作为商业,最重要的群体有三个,供应商、消费者、工作人员。供应商是为我们提供货品,提供品牌文化。消费者是为生活需要购买、使用商品、接受服务的人。然而我们就是供应商和消费者之间的桥梁,我们要服务于消费者与供应商之间。社会在进步,我们商业也在发展。每个时代都有每个时代的代表作,在多元化的今天,在信息时代的今天,做到客观、精准、系统的分析,才会使企业更好地进步。结合社会现在的状...

2020-05-12 15:56:36 3254

比例预测法.xlsx

该资源为比例预测法应用的完美实例,将比例预测法运用到日常的数据中。希望能够对大家学习比例预测法有所帮助,数据纯属虚构,但是也能够反应真实的经营情况。

2020-11-06

供应商评分系统.docx

我们针对供应商应该更全面的评估,不能单单只考虑我们的利益,我们需看到更加长远的目标。没有一个品牌的发展是一帆风顺的,也没有一个商业的发展是不遇到考验的,用科学的方法进行管理,才是最完美的方法。

2020-05-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除