自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(40)
  • 收藏
  • 关注

原创 北京购房攻略(4.17)

购房全步骤1.房屋类型2.税费合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入在北京买房和相关流程还是比较复杂的,涉及的东西比较多也比较乱。本文将从税费到过户详细介绍购买一手房和二手房的全部流程。1.房屋类型总的来说有房本的都能交易,但

2021-04-11 16:00:41 3904

原创 决策树(理论部分)

决策树的理论部分什么是决策树决策树的工作原理如何建立决策树Hunt算法选择最佳划分的度量什么是决策树决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,他代表的是...

2020-02-06 17:46:27 481

原创 python数据挖掘(6.转换器抽取特征)

数据源特征抽取是数据挖掘人物最为重要的一环,一般而言它对最终结果的影响腰搞过数据挖掘算法本身,如何选取更好的特征没有严格的规定,凭借对数据的理解,还有数据挖掘经验,还不够,还要不停的探索尝试,同时也需要一我们对于某些不是特征的数据进行数据挖掘的时候第一步就是把现实用特征表示出来,然后我们才可以使用数据挖掘找到我们问题的答案。特征选择的另一个优点诗:降低真是世界的复杂度,模型总比现实更容易曹总,...

2019-12-18 09:22:58 219

原创 python数据挖掘(5.Apriori算法)

第一章我们介绍了最基础的亲和性分析,尝试了所有的规则计算了所有的置信度和支持度,但是这个方法效率不高而且我们使用的数据集只有5种商品,但是实际生活中即使是小商店的商品也会超过百种,而网店商品的种类则可能更多,依旧使用第一章的亲和性分析,那么随着商品数量的增加,计算量和计算的时间也会急剧增加,所以需要一个聪明的算法来解决这个问题Apriori算法Apriori算法诗一个景点的亲和性分析算法,他只...

2019-12-09 18:46:51 427

原创 python数据挖掘(4.决策树)

数据源本章介绍另一种分类算法:决策树,比起其他算法决策树最主要的一个优点诗决策过程是机器和人都能看懂的,我们使用机器学习到的模型就能完成预测任务,另一个优点是他可以处理多种不同类型的特征。我们这章使用的数据请在文章开头的数据源中python数据挖掘/Chapter4中的文件这一章的数据诗NBA2013-2014赛季的比赛数据,这是一个CSV文件,我们将它读取到pandas中看一下In [1...

2019-12-03 17:53:51 755

原创 python数据挖掘(3.scikit-learn估计器分类 近邻算法)

scikit-learn为了帮助用户实现大量分类算法,scikit-learn把相关功能封装成了所谓的估计器,他用于分类任务。主要包含了两个函数fit():训练算法,设置内部参数,该函数接收训练集及其类别两个参数predict():参数为测试集。预测测试类别,并返回一个包含测试集各条数据类别的数组。近邻算法近邻算法可能诗标准数据挖掘算法中最为直观的一种,为了对新个体进行分类,它查找训练...

2019-11-28 23:14:02 323

原创 python数据挖掘(2.分类 OneR算法)

数据源分类是数据挖掘最为常用的方法之一,无论实际应用还是调研,都需要它的帮忙。对于分类问题,我们通常能拿到表示实际对象或时间的数据及,而数据集中每一条数据都有所属于的类别,这些类别把一条条的数据划分为不同的类。我们举几个例子根据检测数据确定植物的种类。类别值为“各类植物”(各种各样的植物名称)图片中是否包含汽车。类别是‘是否包含汽车’(是否)上面2个问题中第一个类别为各类的植物,例如植物A...

2019-11-27 15:39:22 369

原创 python数据挖掘(1.亲和性分析)

python数据挖掘(1.亲和性分析)数据源(python数据挖掘文件下的chapter1)亲和性分析亲和性分析根据样本之间的相似度,确定他们关系的亲疏。下面我们说一个非常常见的应用场景,顾客在买一件商品时,商家可以趁机了解他们还想买什么,以便把多数顾客愿意同时购买的商品放到一起增加销量以提升销售额,当商家收集到足够多的数据时,可以进行亲和性分析,确定哪些商品放到一起出售效果最佳。亲和性...

2019-11-26 15:44:56 533

原创 Vue.js(声明和渲染)

Vue的声明和渲染去Vue官网看了一下自己试试遇到了不少问题,在学习的过程中记录一下本文使用vue-cli脚手架生成项目。既然是刚刚学习,我们就把所有的东西都写App.vue里吧我发现如果直接复制官网上的代码是行不通的我们看一下官网的一个例子我直接复制过去发现页面是一面空白的,需要改为下面的格式注意修改完成后需要保存,你的网页才会刷新保存后完事了,我们完成了第一个Vue应用...

2019-10-12 16:41:39 175

原创 Pandas 数据分析-第十章(汇总和描述)

Pandas对象拥有一组常用的数字和统计方法,这一章就简单的说一下这些方法sum()我们就直接来看看示例吧In [4]: df = pd.DataFrame({"one":[1.4,2.0,np.nan,0.22],"two":[np.nan,-2.4,np.nan ...: ,-3]},index=list("abcd")) ...

2019-09-26 16:24:55 148

原创 Pandas 数据分析-第九章(带有重复值的轴索引)

到现在为止,我们看到的所有示例都有唯一的索引,虽然许多pandas函数都要求标签唯一,但是这并不是强制性的,我们来看看下面这个SeiresIn [93]: obj = pd.Series(range(5),index=['a','a','b','b','c']) ...

2019-09-24 15:24:47 252

原创 Pandas 数据分析-第八章(排序sort_index())

根据条件对数据集排序是非常常用的一种内置运算,要对行或列索引进行排序,可以使用sort_index方法。对于SeriesIn [64]: obj = pd.Series(range(4),index=['b','d','c','a']) I...

2019-09-24 12:00:07 3747

原创 Pandas 数据分析-第七章(函数应用和映射apply,applymap)

Numpy的ufuncs也能用在Pandas对象上举个例子In [4]: frame = pd.DataFrame(np.random.randn(4,3),columns=['one','two','three'], ...: index=['a','b','c','d']) In [5]...

2019-09-24 11:28:32 262

原创 从头开始学Tableau-第二十章(广告投放分析)

数据源在网络上投放广告,我们需要关注广告的平均点击成本,点击率一级那些个位置的广告最有效,本节我们用Tableau分析一组网络广告投放的数据,用来判断投放的广告是否取得预期的效果。广告分组CTR视图首先构造一张面积图,通过视图可以分析每个广告组的类别在各个星期的点击率是什么情况首先连接数据源“网络广告点击量数据.xlsx”我们需要创建一个计算字段“点击率”点击率=sum([点击量])...

2019-09-23 16:50:31 904 1

原创 从头开始学Tableau-第十九章(石油产量分析)

数据源本节要介绍一个油井产量与收入的数据分析案例,但是我们的重点是学习参数的使用。油井油井CO2排放量我们使用的数据是“油井数据.xlsx”我们连接上数据看一下大致上都是一些价格和收入的数据。我们将‘油井编号’放到【维度】中分别双击“Latitude”和‘Longtitude’(经纬度)这时会生成一张地图,由于经纬度在度量中,所以我们需要将经纬度先转换成维度分别点击在【行】和【...

2019-09-18 15:21:17 877 1

原创 从头开始学Tableau-第十八章(参数进阶)

数据源参数和计算字段的使用标志着你是否是一名Tableau高手,未来几章我们学习参数的进阶使用这一章我们依旧使用保险行业的数据,在保险业中,我们常常有大量的数据需要分析,需要掌握客户的赔付,公司的赔付情况,对一个保险公司非常重要识别与预测本小节要对一家保险公司的经营情况进行分析,得出各年龄段的不同性别客户的索赔额与实际赔付额的情况,以及哪个省份情况特殊,并且预测赔付的金额。索赔分析首...

2019-09-16 17:01:58 581

原创 从头开始学Tableau-第十七章(客户细分)

数据源这一章我们分析一个网站的访问者,由于大型门户网站的数据量相当大,是的部分数据分析软件无用武之地,就需要Tableau来帮我们完成海量数据的可视化并实现相关分析,我们使用一份模拟的网站数据,来对访问者进行客户细分分析。网站客户细分访问树图/地图老样子先看一眼我们的数据这套数据有丰富的地理信息,还有一些访问的信息。首先我们从地理上观察一下。1.1 先将‘类型编号’从【度量】挪到...

2019-09-10 17:10:39 1455

原创 # 从头开始学Tableau-第十六章(资产监控)

数据源本节将通过一个能源行业的案例,进一步讲述仪表盘的设计技巧,数据来源于某能源公司控制台的资产监控记录。能源的分析侧重于地理区域,要考虑当地的人力资源,法律等问题,借助Tableau软件,可以通过强大的突显和筛选功能将地理信息与其他分析融合起来。年度分析使用‘资源监控.xls’首先将地名编号从【度量】挪到【维度】,右键年份,设置为【转换为离散】将日期和累计石油量分别放入【列】和【行...

2019-08-30 14:50:12 443

原创 # 从头开始学Tableau-第十五章(人力资源可视化分析)

数据源以后就不加之前章节的链接了。这一章是一个关于人力资源方面的案例,一个公司人员越多,泽人员的分配及更替越是困难,通过Tableau可以分析识别出公司的人员特征,比如各部门的人员分配情况,是否到达退休年龄。职工特征散点图分析本小节通过散点图结合颜色来展现职工的主要特征链接数据‘继任规划.xls’先将职工编号从度量改为维度,右键年龄选择【转换为离散】将年龄和职工编号分别放入【列】和...

2019-08-30 11:05:18 2084 1

原创 Pandas 数据分析-第六章(算数运算)

pandas最重要的一个功能诗他可以对不同索引的对象进运算,啥意思呢?看一下下面的例子In [85]: s1 = pd.Series([7.3,1.1,2.5,-3],index=['a','c','d','e']) In [86]: s2 = pd.Series([-1,2.3,4.5,-2.2,9],index=['a','c','e','f','g']) ...

2019-08-29 16:38:08 246

原创 Pandas 数据分析-第五章(选取和过滤loc,iloc)

pandas如何选取自己想要的部分呢?非常简便看↓Series索引的工作方式其实很类似于NumpyIn [17]: obj = pd.Series(np.arange(4),index=['a','b','c','d']) In [18]: obj ...

2019-08-29 11:36:58 872

原创 Pandas 数据分析-第四章(丢弃指定轴上的项)

Pandas 数据分析-第四章(丢弃指定轴上的项)这一章我将介绍操作Series和DataFrame中数据的基本手段,如何丢弃制定轴上的项。由于需要执行一些数据整理或集合逻辑,所以drop方法返回的是一个删除了指定index的新对象。虽然上一章我们简单使用过,这里还是需要再说一下。In [5]: obj = pd.Series(np.arange(5),index=['a','b','c','...

2019-08-28 17:05:01 240

原创 # 从头开始学Tableau-第十四章(资源组合分析)

第一章 第二章 第三章 第四章 第五章 第六章 第七章 第八章 第九章 第十章 第十一章 第十二章 第十三章数据源这一节通过模拟一份能源行业的数据,全面展示趋势图的美化,以及趋势线,军直线,参考线等的设计。读入数据‘资源组合分析.xls’在数据窗口中将‘地名’从【度量】拖到【维度】中将‘累计石油量(立方米)’和‘累计水量(立方米)’分别放入【行】和【列】中,将地名和年份放入...

2019-08-28 15:55:10 388

原创 从头开始学Tableau-第十三章(美化)

从头开始学Tableau-第十三章(仪表板美化)第一章 第二章 第三章 第四章 第五章 第六章 第七章 第八章 第九章 第十章 第十一章 第十二章数据源这一章节学习如何美化图表,这也是一个保险行业的案例,通过一份模拟的数据进行欺诈监测,在保险业,数据分析技术主要用于新客户的获取分析,产品的购物篮分析,客户细分,客户流失以及诈骗监测分析。保险业欺诈检测这次使用的数据是“...

2019-08-28 13:10:33 2919

原创 从头开始学Tableau-第十二章(实战3 地图实践)

从头开始学Tableau-第十二章(实战3 地图实践)第一章 第二章 第三章 第四章 第五章 第六章 第七章 第八章 第九章 第十章 第十章数据源这个实践主要是用地图来呈现数据,我们所用的是保险的数据,我们先来看一下数据都有啥,打开‘索赔分析.xls’很明显这套数据中的有非常多的地理信息,我们要分析的是索赔额和支付额和地域的关系。首先吧省级的地理角色设置为“省/市”,服...

2019-08-26 13:50:32 668 1

原创 从头开始学Tableau-第十一章(实战2 参数设置)

从头开始学Tableau-第十一章(实战2 网站内容评估)第一章 第二章 第三章 第四章 第五章 第六章 第七章 第八章 第九章 第十章数据源本章案例的目的诗掌握参数的另一种设置方法,以及散点图在网站内容评估中的应用,了解通过设置Tableau中的不见,来灵活的展现首页,或者N级页面当中不同的没接类型的客户访问量,跳出率等数据我们先来看一下数据‘网站内容评估.xls’...

2019-08-09 14:53:11 740

原创 从头开始学Tableau-第十章(实战1 学校教育评估)

从头开始学Tableau-第十章(实战1 学校教育评估)第一章 第二章 第三章 第四章 第五章 第六章 第七章 第八章 第九章数据源其实我也不知道我会写多少章节,所以不是每章都会有数据源,如果你发现GitHub上没有对应章节的数据,请在往前找(假如这是第20章节,而我的git里只有标题为17章数据源的数据,那么20章的数据源就在17章中。我打算写3个实战项目,这次第九章的数据...

2019-08-08 17:03:49 1682 2

原创 Tableau基础-第九章(仪表盘 创建动作)

从头开始学Tableau-第九章(仪表 创建动作)第一章 第二章 第三章 第四章 第五章 第六章 第七章 第八章数据源上一章我们知道了如何创建仪表盘,让我们可以从不同角度分析公司的经营状况,现在我们希望多表之间的联动,点击地图上的某个省份或城市时其他的图标显示对应省份的城市数据。(上一章我们说过“添加至筛选器”)今天讲的更为完善。我们的目的是点击地图上的省份时,对应的产品市场...

2019-08-07 15:18:11 2209 1

原创 Tableau基础-第八章(仪表盘创建)

从头开始学Tableau-第八章(仪表盘创建)第一章 第二章 第三章 第四章 第五章 第六章 第七章数据源前面几章介绍了各种图表的制作,让我们可以迅速的制作没关大方的交互图表,但是有一个问题,我们之前做的图每次只有一张,那么能不能在一个页面中显示多种图表呢?那就要用到“仪表盘”了。这章介绍仪表盘的创建,我们在之前的章节中创建了很多图表,这里我只用到四张各产品市场表现(条形图)...

2019-08-06 16:48:20 1846

原创 Pandas 数据分析-第三章(索引)

Pandas 数据分析-第三章(索引)pandas的索引对象负责管理周标签和其他元数据,构建Series或者DataFrame诗所用到的任何数组或其他序列的标签都会被转成一个index举个

2019-08-05 16:08:53 1356

原创 Pandas 数据分析-第二章(Pandas数据结构Dataframe)

Pandas 数据分析-第二章(Pandas入门:数据结构Dataframe)第一章:Pandas数据结构Series上面附上了一篇Series的文章,在看Dataframe之前必须先明白什么是Series。DataFrameDataFrame是一个表格型的数据结构(表格嘛你懂的)。每列可以诗不同的值类型(数值,字符串,布尔值)也可以理解为由Series组成的字典,回顾一下Series,S...

2019-08-05 13:58:21 328

原创 Pandas 数据分析-第一章(Pandas数据结构Series)

Pandas 数据分析-第一章(Pandas入门) 如果要学习pandas numpy之前请先在了解一下python,并学习相关基础主要是基础语法和内置的数据结构(列表,字典,元祖,等)python非常简单易学。相信不会花费你很多时间本文以及后续章节使用的均是python3版本,在此我建议使用IPython或Jupyter notebook也是十分方便安装网上一大堆,我就不浪费大家时间了。...

2019-08-02 17:31:18 238

原创 Tableau基础-第七章(可视化4)

从头开始学Tableau-第七章(可视化4)第一章第二章第三章第四章第五章第六章数据源这一章我们结束可视化部分。(1)填充气泡图填充气泡图除了可以通过气泡大小表示某个维度数值大小意外,每个气泡还有标签,而且这些气泡不是一次排在一条线上。链接到数据源(某公司销售数据)后一次双击’产品类别’和’销售额’,之后选择智能图表中的填充气泡图。填充气泡图也可以钻取,我们之前做过分层结...

2019-08-02 16:15:55 568

原创 Tableau基础-第六章(可视化3)

从头开始学Tableau-第六章(可视化3)第一章第二章第三章第四章第五章数据源原来的数据失效了,点进去下载对应章节的数据就OK了我们继续学习各种图(1)数据地图这是一个非常有趣快捷的数据呈现方式,只要我们的数据中有**“地理”信息**我们数据中有一项“省份”的数据,我们右键“省份”→“地理角色”→“省/市/直辖市”之后双击一下“省份”,之后分别双击“销售额”和“利润额”...

2019-07-31 17:27:28 739

原创 Python机器学习第一章-(线性回归)

Python机器学习第一章-(线性回归)这次我们通过python的一些库来研究一下机器学习,至于什么是机器学习,网上写的东西很多,也很杂,具体是啥我们通过后面的教程来看一下。Pandas和Numpy是学习机器学习的前提,不熟悉的同学可以先找一些教程学习,本人后续也会更新Pandas和Numpy的教程。        这一章我们的目标是如何找到一个适合自己的出租房。。。相信大多数人都遇到过找...

2019-06-24 12:00:18 944

原创 Tableau基础-第五章(可视化2)

从头开始学Tableau-第五章(可视化2)第一章第二章第三章第四章数据源这章继续学习可视化的其他图表。(1)动态图动态图就是让图像动画一样播放,动态图可以用来观察数据的连续变化,比盯着一副不会动的图腰更有效。比如想要动态的观察销售额和利润,并对比销量和利润的变化趋势数据源:‘某公司销售数据’我们将‘订单日期’拖入列,将‘销售额’,‘利润额’拖入行。之后调节时间到‘月’按住...

2019-04-22 13:40:21 876

原创 Tableau基础-第四章(可视化1)

从头开始学Tableau-第四章(可视化)第一章第二章第二章数据源这一章主要介绍一下Tableau中各式各样的统计图表。FGNB!(1)条形图在前面几章中,我们大多数使用的都是条形图,这一次系统的学习一下。条形图可以快速的对比各指标值的高地,尤其诗当数据是分为几个类别诗,使用条形图会非常有效,很容易发现各项数据间的差异。为了分析某公司各类产品的销售和利润情况,可以用条形图来展示数...

2019-04-20 11:09:34 965

原创 Tableau基础-第三章(快速表计算)

从头开始学Tableau-第三章(快速表计算)第一章第二章数据源这一章主要介绍一下快速表计算,在前面的2章中我们基础的了解了一下Tableau的函数,有时候并不希望每一个指标值都用函数去构造,那样就太麻烦了,对于已经用函数构造好的新字段,我们同样希望看到平均值、最大值、占比等等更多的信息。(1)快速计算表简介受限链接导数据源,分别双击‘订单日期’,‘销售额’右侧有一个智能图表的工具栏...

2019-04-19 16:08:53 3008

原创 Tableau基础-第二章(函数)

从头开始学Tableau-第二章上一章节我们初步使用了一哈Tableau,有了一些小感受。不熟悉的伙伴们点击下面的链接第一章数据源1. 参数设置我们依旧使用‘某公司销售数据.XLS’在制作可视图的过程中,有啥需要构造一个可以动态变化的参数来帮助分析,这个参数可以放到一个函数中也可以用于筛选,下面我们介绍一下参数的创建。创建一个参数非常简单,连接到数据源后在左侧【维度】【度量】中选中某...

2019-04-19 15:05:27 1976

原创 Tableau基础-第一章(初学者)

从头开始学Tableau-第一章废话不多说,都说Tableau是最好用的BI分析工具,纯粹当一起学习一起进步。数据源1. 排序观察产品类别销售额我们使用“某公司销售数据.xls”这个表中的数据来做一次尝试首先连接到数据“某公司销售数据.xls”,点击屏幕下方的工作表1,将左侧的‘销售额’,‘产品类别’分别拖入【列】【行】中OK我们的第一个图出现了。红色圈住的地方可以选择各种方式进行排...

2019-04-18 15:39:27 8457 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除