自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 【Python】操作word文档

#导入相关扩展包import docxfrom docx.enum.text import WD_ALIGN_PARAGRAPH#设置对齐格式from docx.shared import Pt#设置字体大小from docx.shared import Inches#设置缩进,图片大小等from docx.oxml.ns import qn#(1)写入word文件#首先,创建一个Document对象,即word文档doc = docx.Document()#添加一段文字p1 =

2020-12-21 23:32:35 600

原创 【Python】plt.savefig()保存图片不完整,x轴标签被截断

今天在用Python的plt.savefig()函数保存图片到本地时,发现保存下来的图片不完整,x轴标签被截断了。经过一番搜索,找到了解决方法:加上参数bbox_inches = 'tight'即可:plt.savefig(r"figure.png",bbox_inches = 'tight')...

2020-12-21 23:30:12 14272 3

原创 【Python】ParserError: Error tokenizing data. C error: Expected 1 fields in line 144, saw 4

Python使用pd.read_csv报错ParserError: Error tokenizing data. C error: Expected 1 fields in line 144, saw 4解决方法:pd.read_csv(path,sep='\t')

2020-12-21 23:27:35 2072

原创 【Python】获取excel所有的sheet名称

import pandas as pdpath = r"excel_file.xlsx"xlsx = pd.ExcelFile(path)xlsx.sheet_names #输出所有的sheet名称

2020-12-21 23:25:15 3219 3

原创 【Jupyter】快捷键

Enter : 转入编辑模式Esc : 退出编辑模式,进入命令模式Shift-Enter : 运行本单元,选中下个单元Ctrl-Enter : 运行本单元Alt-Enter : 运行本单元,在其下插入新单元1 : 设定 1 级标题2 : 设定 2 级标题3 : 设定 3 级标题4 : 设定 4 级标题5 : 设定 5 级标题6 : 设定 6 级标题Up : 选中上方单元Down : 选中下方单元A : 在上方插入新单元B : 在下方插入新单元X : 剪切选中的单元F:查找、替

2020-12-21 23:24:17 358

原创 【Hive】Both left and right aliases encountered in JOIN

执行Hive语句报错:Both left and right aliases encountered in JOIN报错原因:在join的on条件中添加了不相等条件解决方法:把不相等条件放到where中即可

2020-12-21 23:23:19 729

原创 【Hive】unsupport subquery expression

hive报错unsupport subquery expression表示不支持子查询,可以改用left join方式

2020-12-21 23:21:03 1596

原创 【Python】补齐缺失日期

有DataFrame类型数据data,其中有index列为日期,另有value列,补充缺失日期列index代码如下:import pandas as pdimport datetime#创建DataFrame数据,包括index列和value列,其中index列为日期,但是格式为string格式data = pd.DataFrame(data={'index':['2020-10-09','2020-10-10','2020-10-17','2020-10-15'],'value':range(4

2020-12-21 20:03:31 6851 1

原创 【Linux】复制文件前n行、后n行

使用head或者tail重定向如复制文件前1000行:head -n 1000 filename1 > filename2

2020-12-21 19:58:36 3641

原创 【Linux】查看文件行数、字数

wc [选项] 文件-c 统计字节数-l 统计行数-w 统计字数-m 统计字符数

2020-12-21 19:56:20 922 1

原创 【Python】绘制并列柱状图

如下代码:#导入扩展包import matplotlib.pyplot as pltimport numpy as np#构造数据y1 = [1,4,6,8,9,4,3,8]y2 = [2,5,9,5,3,2,7,4]x = np.arange(len(y1))#设置柱状图的宽度width = 0.4#绘图plt.figure(figsize=(8,4))plt.bar(x=x,height=y1,width=width,label='Data1')plt.bar(x=x+

2020-12-21 19:51:10 8123 4

原创 【Python】plt.bar绘制柱状图参数详解

bar(x, height, width=0.8, bottom=None, ***, align='center', data=None, **kwargs)x 表示x坐标,数据类型为int或float类型,height 表示柱状图的高度,也就是y坐标值,数据类型为int或float类型,width 表示柱状图的宽度,取值在0~1之间,默认为0.8bottom 柱状图的起始位置,也就是y轴的起始坐标,align 柱状图的中心位置,"center","lege"边缘color 柱状图颜色ed

2020-12-21 19:48:48 26921 1

原创 【MySQL】float数据类型显示数据后几位不准确

解决方法:将数据类型改为bigint类型即可更改数据类型语句:alter table table_name modify column column_name 数据类型;

2020-12-21 19:44:47 715

原创 【MySQL】Error 1264: out of range value for column

mysql更改数据类型 或者 插入数据 Error 1264: out of range value for column这是由于mysql数据长度限制

2020-12-21 19:33:03 1287

原创 【Hive】向下取整,向上取整,四舍五入

floor函数向下取整select floor(1.2)1ceil函数向上取整select ceil(1.2)2round函数四舍五入select round(1.283,2)1.28

2020-12-21 19:25:24 1535

原创 【R语言】绘制权重散点图

library("plotly")plot_ly(data = df, x = ~age, y = ~income, size = ~weight)

2020-12-20 16:50:21 1136 1

原创 【R语言】绘制权重直方图

library("plotrix")weighted.hist(x=df$feature,w=df$weight,breaks=seq(1,100,length.out=11),freq=F,col=rainbow(11))#weighted.hist函数参数x为绘制直方图对象,w为权重

2020-12-20 16:39:45 1470

原创 【R语言】创建空的dataframe

如下:df = as.data.frame(matrix(nrow=0,ncol=3)) #创建一个3列的空对象

2020-12-20 16:36:56 18822

原创 【R语言】data.frame 分组计数、求和等

df为1个data.frame对象,有stratum和psu两列,这里统计stratum列计数方法1:cnt = table(df$stratum)方法2:cnt = tapply(df$psu, INDEX=df$stratum, FUN=length)在方法2的基础上,只要改变FUN函数就可以实现分组求和、求均值等功能,如下分组求均值:tapply(df$psu, INDEX=df$stratum, FUN=mean)#(等价于python中的df.groupby('stratum'

2020-12-20 16:35:23 13050

原创 【R语言】pps采样

pps采样,全称是Probability Proportionate to Size Sampling,用R进行pps采样代码如下:pik <-inclusionprobabilities(data$psu,n=2)s <- UPmultinomial(pik)sam <- data[s!=0,]

2020-12-20 16:22:08 3241 1

原创 【R语言】对data.frame的行随机抽样

df是R中的data.frame对象,对其行进项无放回随机采样,直接使用以下代码即可:df[sample(nrow(df), 10), ]

2020-12-08 20:47:34 11859 3

原创 【R语言】随机采样

R语言中,进行随机采样可以使用sample函数,具体如下:#函数:sample(x, size, replace = FALSE, prob = NULL)#参数含义x:向量,表示抽样的总体,或者是一个正整数,表示样本总体为1~nsize:为样本容量,即要抽取的样本个数,是一个非负整数replace:表示是否为有放回的抽样,是一个逻辑值,默认为FALSE,即默认为无放回抽样;prob:为权重向量,即x中元素被抽取到的概率,是一个取值0~1的向量,其长度应该与x的长度相同。参考链接:http

2020-12-08 20:29:21 3331

原创 【R语言】rpois函数参数详解

想要了解更多可以去官方文档查看,链接。rpois函数主要用于产生泊松分布的随机数,其中参数n代表产生数据个数,参数lambda表示产生一组数据的(非负)均值,具体如下:rpois(n, lambda)n:number of random values to return.lambda:vector of (non-negative) means....

2020-12-05 15:00:48 8673

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除