自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 python实现选择排序法

1、选择排序法不是稳定排序法,空间复杂度为最佳,只需一个额外空间2、无论是最坏情况、最佳情况还是平均情况都需要找到最大值(或最小值), 因此比较的次数是(n-1) + (n-2) +…+3 + 2+1 = n(n-1)/2, 时间复杂度为O(n^2)3、此排序法适用于数据量小或有部分数据已经过排序的情况数据从小到大排序:def showdata(data): for i in ...

2019-09-21 21:06:15 483

原创 python实现冒泡排序法

1、冒泡排序法是稳定排序法,空间复杂度最佳为1;2、最坏和平均情况需要进行n(n-1)/2次扫描,时间复杂度为O(n^2)3、最好的情况只需要进行一次扫描,n-1次比较,时间复杂度为O(n);4、此排序法适用于数据量小或有部分数据已经过排序的情况把数据从小到大进行排序:def showdata(data): for i in range(len(data)) : # 使用循...

2019-09-21 20:36:30 925

原创 数据百问系列之七: 在Hive中遇到了数据倾斜该如何处理?

本次讨论的主题是: 在Hive中遇到了数据倾斜该如何处理?问题:你在工作中有哪些小技巧或者套路来处理数据数据倾斜问题?分析:本话题是一个发散性的话题,并没有限制太多的内容,主要是想跟大家讨论一下当我们在工作中遇到数据倾斜的时候,大家都是怎么处理这一类问题的,有什么小技巧或者套路来处理这一块的问题?对于这个话题,我觉得群友们的讨论已经很极致了,所以下面的文章中我就根据大家讨论的情况...

2019-09-18 23:56:04 311

原创 数据百问系列之六:数据仓库中的主题域是如何划分的?

本次讨论的主题是: 数据仓库中的主题域是如何划分的?问题:你在工作中和交流中,有主题域划分的例子可以分享吗?分析:本话题是一个发散性的话题,并没有限制太多的内容,主要是想跟大家讨论一下在工作和交流中大家都是怎么划分主题域的。对于这个话题,我觉得群友们的讨论已经很极致了,所以下面的文章中我就根据大家讨论的情况对这个话题进行一个整理与补充一点个人的理解(站在巨人们的肩上看问题~)关...

2019-09-18 23:09:56 11707 1

原创 数据分析流程

数据分析的流程有六步:一、商业理解:本阶段的要点:定义商业需求评估现状定义数据挖掘/分析的目标准备项目计划二、数据理解本阶段的要点:收集数据描述数据识别及探索数据三、数据准备本阶段的要点:选择数据清理数据结构化数据集成数据格式化数据四、建立模型本阶段的要点:选择技术设计测试建立模型评估模型五、阶段评估本阶段的要点:评估结果复...

2019-09-06 22:18:23 306

原创 python extend和append的区别

区别:append() 方法向列表的尾部添加一个新的元素。一次只接受一个参数;extend()方法只接受一个列表作为参数,并将该参数的每个元素都添加到原有的列表中;demo:a = ["a", "b"]b = ["c", ["d", "e"]]append循环:for i in b: a.append(i)aextend循环:for i in b: a.e...

2019-09-06 13:00:19 160

原创 统计学系列:平均工资背后的统计学知识

0x00 前言让我们从最近很火的一个小案例入手:前些日子,腾讯发表了上半年的财报,随后,“腾讯月平均工资破7万”的消息不胫而走,也因此催生了不少柠檬树。不管你酸不酸,反正我是很酸的,于是乎,就跑去问了居士:“大佬,你的工资有7w+吗?”居士曰:“我倒是希望我的工资能有7w+…”他这么一说,我突然就不酸了,哈哈哈,原来居士也是“被平均”了的一分子(可能这就是一种阿Q式的心理安慰了)。那么站在统...

2019-09-05 17:33:36 3213

原创 数据百问系列之五:什么是数据资产?

本次讨论的主题是:什么是数据资产?问题:大家所处的工作环境里面,有没有和数据资产相关的项目或者使用场景?分析:本话题是一个发散性的话题,并没有限制太多的内容,主要是想跟大家讨论一下关于“数据资产”这个话题,大家在都是怎么理解的。对于这个话题,我感觉需要拆开来看,首先需要先弄懂什么是数据?其次是弄懂什么是资产?最后再综合讨论一下什么是数据资产?关于数据:1、数据(data)...

2019-09-05 17:25:34 2093

原创 人物访谈:会计成功转型数据分析

今天,跟着大佬去访谈了某大厂的一个数据分析师罗生,问到的问题很多,在讲述自己从会计转型到数据分析的过程中的思想及准备,我觉得对自己的启发很大,故记之。背景介绍:罗生原先毕业于一所三本的学校,大学读的是财会专业,毕业后顺利地在一所二线城市找了一份还算不错的会计工作,但因某次闲聊中知晓了同部门大佬级别的工资,故决定要转型,不想自己就这么一直做下去。转型的时候,听从了堂姐的建议,决定转型数据行业。...

2019-09-05 17:18:39 1041

原创 CASE WHEN数据归类

student表通过s_id与score表连接score表通过c_id与course表连接student表的数据score表的数据:course表里面的数据通过case when 和group by 函数将输出的结果按照姓名横向排序便于观察数据tips: group by之后的数据只返回第一行, case when 进行判断后的数据也只返回第一行,所以需要使用max函数将case...

2019-09-02 20:02:05 269

原创 SQL之limit

limit可以用来按照位置抽取记录用法:select * from table limit start, numberstart 表示数据开始检索的位置,number表示需要抽取的数据数量。栗子:从第5个记录开始抽取10条数据:select * from table limit 4, 10; ...

2019-09-01 17:26:04 230

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除