自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(43)
  • 收藏
  • 关注

原创 Python词云wordcloud——根据词语生成图像

wordcloud作者github应用实例:https://github.com/amueller/word_cloud/blob/master/examples/masked.py官网:https://amueller.github.io/word_cloud/generated/wordcloud.WordCloud.html内容包括:生成中文词云、英文词云、根据单词出现频率生成词云...

2019-10-28 20:43:33 4186

原创 【POWER BI商业数据分析】销售目标分解

POWER BI商业数据分析项目实战 第六章实践目标:通过2017年的日销售数据和2018年各月销售目标,拆解每日的销售目标。核心思路: 应该树数据化零售里面星期N权重指数这个概念,大概理解为赋予星期N不同的权重,从而计算销售目标。累积求和计算每一天的销售额,并提取日期中月份、星期的有用信息对每个月,计算所有星期一的总销量/该月星期一的天数,得到X月X天的平均销售X月X...

2020-03-28 22:37:06 2159 3

原创 【mysql 练习题】查询和“01”号同学所学课程完全相同的其他同学的学号

先说一件有点难过的事情,我还是放弃了想做数据分析师~投了好多好多好多的简历,只有几个面试,可能真的和我长时间的空白期有关吧,哪怕很认真准备了很久也没办法得到青睐。把mysql的50题刷完~看一看剩下的投递里会不会有面试,这段很努力很努力的时光就暂时封存起来吧,可能未来我会在知识产权领域大有作为呢!如果有需要数据分析相关资源的小伙伴可以找我~python,mysql,power bi,商业数据分...

2020-03-28 00:45:19 10699 8

原创 Airbnb产品运营数据分析

数据清洗:相比SQL一条条语句查询,用python可以更直观看到数据的缺失情况。数据缺失:date_first_booking缺失124543条数据,有可能是由于这些用户没有下过订单。age缺失87990条,存在极小值1,极大值2014,分析age需要排除异常点。first_affiliate_tracked(用户通过哪个营销广告进入)缺失6065条数据。直观得...

2020-02-23 18:16:02 2423 1

原创 【随手练】SQLZOO部分习题

"Monaco-Ville"是合併國家名字 "Monaco" 和延伸詞"-Ville".顯示國家名字,及其延伸詞,如首都是國家名字的延伸。你可以使用SQL函數REPLACE或 MID.SELECT name,REPLACE(capital,name,'')FROM worldWHERE capital LIKE CONCAT(name,'_%')相关函数:REPLAC...

2020-02-17 22:56:34 579

原创 数据库基础知识

一边复习一边把重要的内容摘出来以便自己查找~不是很全,只涉及基础操作SQL层流程:MySQL语句SQL层流程:SQL语句-缓存查询-解析器-优化器-执行器查询缓存:如果查询缓存中有这条SQL语句则直接将结果返回客户端,没有就进入解析器。8.0以后没有解析器:进行语法分析(拼写是否正确,语法错误)、语义分析(访问对象是否存在,比如列名错误)。优化器:确定SQL语句执行路径(全表检...

2020-02-16 23:05:18 198

原创 用Python分析淘宝用户行为

数据来源:阿里云 天池数据集https://tianchi.aliyun.com/dataset/dataDetail?dataId=46阿里巴巴提供的移动端淘宝用户的行为数据集,包含2014-11-18至2014-12-18共计一千多万条数据。为了解用户在双十二期间的行为和商品情况,选取2014-12-08至2014-12-15这一周的数据作为分析样本。数据集的每一列描述如下:列...

2020-02-13 21:51:37 3382 1

原创 Python模拟社会财富分配——努力者和幸运儿谁更可能是富翁

一个财富分配游戏:房间里有100个人,每人都有100元钱,他们在玩一个游戏。每轮游戏中,每个人都要拿出一元钱随机给另一个人,最后这100个人的财富分布是怎样的?涉及的知识:np.random.choiceGenerates a random sample from a given 1-D arraynumpy.random.choice(a, size=None, ...

2020-02-03 16:41:52 2116

原创 【Python随手练习】数据清洗

import pandas as pdimport osos.chdir('C:\\Users\\Violette\\Desktop\\')data1=pd.read_csv('11数据.csv',encoding= 'gbk',header=None)data1.rename(columns={0:'No',1:'Name',2:'Age',3:'Weight'},inplace...

2020-01-30 10:54:18 766

转载 【转载】Seaborn绘图

以前粗略的学习过Matpl...

2020-01-15 14:40:42 326

原创 跟Kaggle做泰坦尼克乘客生存分析

参照kaggle来学习Python数据分析的思路和方法:https://www.kaggle.com/startupsci/titanic-data-science-solutions简书上这个写的也蛮有趣可以看一下https://www.jianshu.com/p/9a5bce0de13f中间夹杂了一些微专业视频中的图表,完全跟做下来,其实对如何认识数据、清洗数据有了初步的认识。虽...

2020-01-15 12:30:53 764

原创 distplot—edgecolor边缘线

之前在jupyter中使用matplotlib中作图边缘线,只能一次次加edgecolor来调整。今天学到seaborn中用jointplot绘制综合散点图,发现edgecolor只能调整散点不能对直方图增加边缘线(也可能是我没找到相应的参数)。找了好久的资料,终于在http://www.cocoachina.com/articles/53160找到解决的方法:plt.rcParams["...

2019-12-19 15:40:52 4867 1

原创 Python学习笔记——matplotlib pyplot绘制子图

import numpy as npimport pandas as pdimport matplotlib.pyplot as plt最常用的是第三个fig,axes = plt.subplots的方法。plt.figure+plt.plot直接plot会自动生成figure,如果设置figure(num图表序号,figsize图表大小),则每个plot会放到最近的figure中。f...

2019-12-03 20:09:06 1166

转载 【转载】pandas concat

1 concatconcat函数是在pandas底下的方法,可以将数据根据不同的轴作简单的融合12pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, keys=None, levels=None, n...

2019-11-28 22:05:13 134

原创 Pandas入门——时间序列 datetime Timestamp

参考视频、官网、和微信相关文章官网:https://pandas.pydata.org/pandas-docs/stable/user_guide/timeseries.htmldatetimedatetime模块是python处理时间和日期的标准库,主要:datetime.date(), datetime.datetime(), datetime.timedelta()1、datetim...

2019-11-16 00:17:41 2325 1

原创 Pandas入门——Series和DataFrame的创建、索引、基本操作

PandasPandas基于Numpy构建,是数据分析的核心模块,可直接读取数据进行处理,兼容各种数据库,支持各种分析算法。因为之前了解到Python安装Pandas很慢,所以直接下载了Anaconda,感觉自己很机智哈哈哈!因为各种镜像源都挂了,下载真的好慢,所以分享一个Anaconda3-5.1.0-Windows-x86_64网盘链接:https://pan.baidu.com/s/1P...

2019-11-13 23:32:32 2816

原创 numpy学习笔记——随机数与存储读取

随机数numpy.random包含多种概率分布的随机样本randrandom.rand [0,1]之间的随机浮点数 平均分布normalnp.random.normal(loc=0.0, scale=1.0, size=None) 正态分布随机数,loc是均值,scale是方差。randintnumpy.random.randint(low, high=None, size=Non...

2019-11-07 23:10:43 229

原创 numpy学习笔记——索引与切片

基础索引与切片ar=np.arange(10)print('一维数组索引同列表')print(ar)print(ar[4])#元素从0开始编号,ar[4]实际上是ar中第五个元素print(ar[:3])#冒号表示从头开始的省略,0,1,2print(ar[::3])#可以通过索引设置步长,步长为3print('\n二维数组')ar2=np.arange(12).reshape(...

2019-11-07 23:09:44 176

原创 Numpy学习笔记——数组运算

数组运算ar=np.arange(1,9).reshape(2,4)print(ar)print(ar+1)print(ar-1)print(ar*5)print(8/ar)print(ar**(0.5))#幂#+= *=print('----------')ar1=np.ones((2,3),dtype=int)ar2=np.arange(1,7).reshape(2,3)...

2019-11-07 23:08:42 199

原创 Numpy学习笔记——数组形状

数组堆叠的stack可能是我无法理解的痛……改变数组形状需要注意ndarry.T 转置,ndarray.reshape()数组相同更改尺寸,ndarray.resize()都是生成新的数组开辟新的内存区域,而非直接更改原有数组,而ndarray.shape是更改原有数组。ar1=np.arange(9)ar2=np.zeros((2,5),dtype=np.int)print(ar1)...

2019-11-07 16:41:29 689

原创 Numpy学习笔记——基本语句

学习碎碎念:因为numpy是pandas的基础,所以学习了这一部分的基础知识,但是因为jupyter实在是太好用了,所以就很不想整理这一部分学习的笔记。最近学习状态不是很好,因为懒惰和懒散,自己每天学习时长太短了~加油啊!好好学赶紧找工作搬砖!numpy的学习主要是看视频资料+numpy官网tutorial+微信文章。官网tutorial:https://numpy.org/devdocs/u...

2019-11-07 11:25:45 820

原创 Python练习题

从做题的水平就可以看出来自己有多菜~安慰自己好好学习进步空间会变大的!!!1、2、3、4这四个数字能组成多少个互不相同且没有重复数字的两位数n=list(range(1,5))k=[]for i in n: num=[i*10+j for j in n if i!=j]#列表生成式 k.extend(num)#extend可以批量添加元素print(n,'共生成',le...

2019-10-30 15:52:06 142

原创 Python学习笔记——读写相关的os、pickle、StringIO、BytesIO模块

内容整理自廖雪峰官网和学习视频osimport os #系统模块-常用命令print(os.name)#输出正在使用的平台 windows-ntprint(os.getcwd())#当前目录名print(os.listdir())#返回指定目录的文件夹中所有文件os.chdir(‘C:\Users\Violette\Desktop\’)#更改当前所在目录os.remove(‘test...

2019-10-29 21:11:47 316

原创 Python学习笔记——open数据读写

学习笔记整理自廖雪峰官网和菜鸟教程open()详细用法见:https://www.runoob.com/python/file-methods.html常用语法open(file,mode=‘r’,encoding=‘utf’)file:文件地址常用mode:‘r’ 默认,以只读方式打开文件。文件的指针将会放在文件的开头,不存在文件则报错。‘w’ 打开一个文件只用于写入。如果该文...

2019-10-29 20:58:49 756

原创 Excel学习之动态图表

廖雪峰Excel动态作图课程利用构建辅助表格目标:选择充值金额、提现金额、投资金额、回款金额其中的一项,呈现对应的各月份的折线图。主要操作:数据有效性选择下拉列表、sumifs选择对应区域、折线图画图1、选择空白单元格-数据验证(Alt+D-L)-允许序列-选择序列区域-形成下拉选项。2、将月份信息复制为新的一行来构建辅助数据3、利用offset函数,ctrl+A打开函数面板,选取...

2019-10-26 15:43:57 853

原创 Python学习笔记——调试logging&pdb

内容整理于廖雪峰官网logging调试中需要知道出错时,哪些变量的值是正确的哪些变量的值是错误的。print可以用print输出值,在输出中查找打印的变量值。但需要在调试后删除print()。assertassert expression[ , arguments]可省略arguments参数相当于if not expression:raise AssertionErro...

2019-10-25 17:10:01 160

原创 Python学习笔记——错误处理try

笔记整理于廖雪峰官网和菜鸟教程错误处理异常:Python脚本发生异常时需要捕获处理,否则程序会中止执行。异常类型:https://www.runoob.com/python/python-exceptions.htmltry…except…else描述检测try语块中的错误,except捕获异常信息并处理。(个人理解)当开始一个try语句后,如果能except错误则继续执行后...

2019-10-25 10:45:49 331

原创 Python学习笔记——枚举Enum

廖雪峰这部分写的有点乱,推荐结合下面博客学习:https://segmentfault.com/a/1190000017327003笔记整理于廖雪峰官网和上述博客定义Enum3.4以前版本pip install enum,from enum import Enum默认枚举成员名对应数值从1开始,如需精准赋值则派生类class Enumname(Enum)成员名不允许重复,成员值允许相...

2019-10-23 17:45:41 303

原创 Python学习笔记——类和实例

笔记内容由廖雪峰官网和菜鸟教程整理得到文章目录面向对象编程类和实例访问限制继承与多态继承__init__子类继承父类构造函数的三种情况获取对象信息判断类型(重点isinstance)对象属性和方法dirgetattr,hasattr,setattr,delattr常用重载功能__xxx__实例属性和类属性练习面向对象编程设计思想:抽象出Class类,根据Class创建Instance实例。...

2019-10-21 22:30:22 167

原创 Python学习——模块Module

笔记内容整理自廖雪峰官网和菜鸟教程模块的意义模块Module是一个以.py结尾的Python文件,能定义函数、类、变量,也可以包含可执行的代码。模块提高代码的可维护性,可以引用其他模块包括Python内置模块和第三方模块相同名字的函数和变量可以被存放在不同的模块中,可以避免函数名和变量名冲突引入包后,顶层包的名称不冲突的情况下,所有模块名都不会冲突。每一各包目录下都有__init__.p...

2019-10-21 08:31:40 157

原创 Python学习笔记——偏函数

笔记整理于廖雪峰官网和菜鸟教程偏函数Python functools模块提供偏函数功能,将函数某些参数设置默认值,返回新的函数,简化调用。from functools import partial#import functoolsdef sum(n,m): return n+msum_99=partial(sum,99)#sum_99=functools.partial(su...

2019-10-20 11:27:53 79

原创 Python学习笔记——装饰器

装饰器笔记整理于廖雪峰官网、菜鸟教程和下面这个博客内容,这一部分和闭包我都看了好久啊,和廖雪峰相比觉得下面的博客更通俗易懂的讲解装饰器~https://blog.csdn.net/xiangxianghehe/article/details/77170585菜鸟教程https://www.runoob.com/w3cnote/python-func-decorators.html廖雪峰...

2019-10-20 10:24:58 190

原创 Python学习笔记——map、reduce、filter、sort

笔记整理自廖雪峰官网和菜鸟教程面向过程编程,把大段代码拆成函数,通过一层一层的函数调用,就可以把复杂任务分解成简单的任务。允许函数本身作为参数传入另一个函数,允许返回一个函数值。高阶函数函数与变量变量可指向函数,函数本身可以赋值给变量>>>abs(-10)10>>>f=abs>>>f(-10)10函数名也是变量...

2019-10-18 14:41:03 202

原创 Python学习——切片、迭代、列表生成式[]、生成器()

笔记由廖雪峰官网和菜鸟教程整理高级特效切片取一个list或tuple的部分元素是非常常见的操作。tuple操作得到的也是tuple不可更改字符串是特殊的list,切片操作得到的也是字符串#用range函数创建0-99的list>>> L = list(range(100))>>> L[0, 1, 2, 3, ..., 99]#取前十个&gt...

2019-10-18 09:37:24 202

原创 Python学习——递归函数

有廖雪峰官网归纳整理递归函数栈溢出和尾递归**栈溢出:**函数调用是通过栈(stack)这种数据结构实现的,每当进入一个函数调用,栈就会加一层栈帧,每当函数返回,栈就会减一层栈帧。由于栈的大小不是无限的,所以,递归调用的次数过多,会导致栈溢出。**尾递归:**解决递归调用栈溢出的方法是通过尾递归优化。在函数返回的时候,调用自身本身,并且,return语句不能包含表达式。这样,编译器或者解释...

2019-10-17 11:05:02 108

原创 Python学习——函数参数

笔记由菜鸟教程和廖雪峰官网总结函数可变对象和不可变对象python中,类型属于对象,变量没有类型。e.g. a=‘Test’ 中,'Test’是string类型,但变量a仅仅是对象的引用(指针),是没有类型的。不可变类型strings、tuples、numbers是不可变类型类似于C++值传递,传递的只是值,不会影响对象本身。a=1后赋值a=2,实际是生成新的int对象2,让a指向...

2019-10-17 10:57:00 153

原创 Python学习笔记——条件判断if和循环for/while

内容整理于廖雪峰官网和菜鸟教程条件判断 ifif语句语句从上到下,执行到True退出判断if <条件判断1>:<执行1>elif <条件判断2>:<执行2>elif <条件判断3>:<执行3>else:<执行4>1、每个条件后都有冒号:2、缩进划分语块3、elif代替else if,...

2019-10-16 21:10:20 271

原创 Python学习笔记——数据类型list、tuple、dict、set

内容整理于廖雪峰官网和菜鸟教程list可变用[] , tuple不可变用()dict={} set()均不可放入可变元素list和tuplelist定义listA=[‘AAA’,‘bbb’,‘ccc’]list的元素可以是另一个listlistB=[‘ddd’,listA]listC=[‘ddd’,[‘eee’,‘fff’]]len(listC)=2 len计算元素数lis...

2019-10-16 20:53:50 233

原创 Python学习笔记——数据类型字符串

内容整理于廖雪峰官网和菜鸟教程字符串和编码编码在计算机内存中,统一使用Unicode编码,当需要保存到硬盘或者需要传输的时候,就转换为UTF-8编码。用记事本编辑的时候,从文件读取的UTF-8字符被转换为Unicode字符到内存里,编辑完成后,保存的时候再把Unicode转换为UTF-8保存到文件。浏览网页的时候,服务器会把动态生成的Unicode内容转换为UTF-8再传输到浏览器。p...

2019-10-16 14:36:46 94

原创 Python学习笔记——数据类型基础

内容整理于廖雪峰官网和菜鸟教程数据类型整数大小没有限制浮点数大小没有限制,超出范围的浮点数为表现为inf无限大字符串字符串用单引号或双引号引起来的文本\转义字符 :可以在单引号或双引号或\前加转义字符\,来转义原本的意义。\n换行,\t制表符。Python还允许用r’’ 表示’‘内部的字符串默认不转义, print(r’\\t\’) 输出\\t\用’’’…’’'的格式表示多行...

2019-10-16 14:30:42 106

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除