自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

peilin.li

peilin.li

  • 博客(10)
  • 收藏
  • 关注

原创 数据分析指标体系总结

这篇文章用来汇总各行业数据分析指标体系,持续更新。优秀的汇总文目录:指标体系总结——神文一些借鉴,来源知乎:

2020-03-25 22:26:02 385

原创 在Anaconda3中安装wordcloud库

step1: 去官网下载wordcloud库官网地址:https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud首先要明确自己的python版本和win版本。本宝宝是python3.7(所以是cp37),win64,因此点击上图红框链接下载(很快就下好了)。step2: 确定下载到的文件夹因为anaconda所有的package都在F:\A...

2020-03-22 14:37:54 7777 4

原创 pandas数据抽取 - 思维导图

一、pandas数据抽取1. Seriess=pd.Series([1,2,3,4])s'''0 11 22 33 4dtype: int64'''#提取多行:s[0:2] #不可用双括号s[[0,1,2]] #不可用单括号'''0 11 2dtype: int64-------------0 11 22...

2020-03-20 22:03:17 355

原创 Pandas中DataFrame修改index、columns名, Series修改index名

常用两个方法:1、使用DataFrame.index = [newName],DataFrame.columns = [newName]#定义一个dataframedict={ 'name':['张三','李四','王五','赵六'],#一列,key为列标签(列索引)。 'sex':['男','男','男','女'], 'age':[18,19,20,21]#不同列的...

2020-03-20 17:25:34 5207

原创 numpy和pandas

1. Pandas - 排序函数sort_values()按照索引(y轴数据标签)排序:by='index', axis=1按照某列排序:by='列', axis=0(axis默认为0)参考文章-有例子2. 中英文的逗号一定要区分开,erro往往来源于此3. Pandas中stack()和unstack(level=0/-1)的形象理解stack是“堆,叠”意思。常见的数据的层...

2020-03-20 16:48:08 154

转载 Hive中存在的数据倾斜问题

真是好久没写博客了。。。趁着今天休息,把以前遇到的问题整理一下吧。互联网中的数据量通常会很大,比如埋点数据。。。因此在日常数据处理中就会遇到数据倾斜的问题,就是那种跑半天跑不出数据或者red...

2020-03-20 10:45:08 234

原创 解决'tuple' object is not callable的报错-python变量命名错误

1. 变量命名要避python内置函数的名字初学python,很容易犯这样的错误,即直接用set, list, tuple, dict, str, int, complex, float等作为变量名。这样会导致这些内置函数:set(), list(), tuple()等等无法执行。例如下例,使用tuple作为变量名,再执行tuple()语句时,会报错 ‘tuple’ object is not...

2020-03-16 17:55:29 23011

转载 SAS data步的操作技能点_2(去重)

1、删除主键有重复的行 nodupkey只要BY主键的值相等,不管其他值是否相等,一律删除data test3;input id1 $ id2 $ extra ;cards;aa ab 3aa ab 3aa ab 2aa ab 1;p...

2020-02-25 13:44:12 2877

原创 SAS语法

1. Use a library to read SAS filelibname libref base "path";proc contents data=libref.table_name;run;libname libref clear;1. Use a library to read EXCEL fileoptions validvarname=V7;libname ...

2020-02-24 09:57:29 2686

原创 Python语法更新

1. 不可变的数据类型,不能赋值Python3 中有六个标准的数据类型:、Number(数字)String(字符串)List(列表)Tuple(元组)Set(集合)Dictionary(字典)Python3 的六个标准数据类型中:不可变数据(3 个):Number(数字)、String(字符串)、Tuple(元组);可变数据(3 个):List(列表)、Dictionar...

2020-02-19 11:06:58 301

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除