自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 问答 (10)
  • 收藏
  • 关注

原创 Excel作图-多层环图制作

多层环图的效果如上,源数据为:绘制步骤如下:Step1:选中第一列和第二列数据后,插入圆环图。Step2:去除”商家名称"水平轴标签选中圆环右击-选择数据源-水平(分类)轴标签-去除"商家名称"Step3:选中第一列和第三列数据,复制,在图表区粘贴。Step4:选中第一列和第四列数据,复制,在图表区粘贴。Step5:调整圆环图内径大小,使环更粗一些。右击圆环-设置数据系列格式,将圆环图圆环大小调整为40%Step6:添加数据标签...

2021-03-26 15:17:48 2446

原创 Tableau作图-商品年度销量排序变化图

20种商品2021年度、2020年度排序变化如上图所示,图中显示了2021年销量TOP20的商品在2020年度的销量排名。初始Excel的表头是像这样的,这样表格形式在已经比较直观了。不过如果需要可视化绘图,我们要更改下表格的初始形态,以保证绘图时各类维度齐全。商品名称2020年排名2021年排名–––更改后的表格形态如下:商品名称年度排名将数据载入Tableau后,绘图步骤如下:Step1:设置纵坐标轴将“商品名称”、“年度”两个.

2021-03-26 14:40:17 2288

原创 Excel作图-二维面积图展现占比变化

二维面积图展现占比变化最终实现效果如上所示,源数据如下:绘制步骤如下:Step1:选中数据,插入"百分比堆积面积图"Step2:修改数据源配置1)首先切换行/列2)图例项中去除“商家名称"3)编辑水平(分类)标签轴,更改成年份Step3:添加数据标签...

2021-03-24 18:26:21 3326

原创 Python pandas遍历读取文件夹、子文件下所有的excel文件

目录遍历读取代码os.walk()文件目录遍历器遍历读取代码前几天收到一个excel拼接预处理的工作,一开始想着拼接能有多难,结果拿到源文件是真崩溃。一个大文件夹杂七杂八揣着若干个小文件夹,excel文件散落各处,而且各个excel文件sheet页的个数和名称也乱七八糟,没有任何规律可循。各个excel表格上充斥着各种人工痕迹,东一榔头西一棒子就是一个先前业务人员插的透视表。总之,是一个非常脏的数据集。那就暴力遍历法,挨个读吧,先把数据读出来,后续清洗的问题也注定是灾难。所以接下来的这段代码实现的效

2021-03-23 18:08:02 22011

原创 Excel作图-子母饼图绘制

子母饼图最终实现的效果如上所示,第四季度数据映射至子饼图。实现步骤如下:Step1:将第四季度放置于表格末端,10月、11月、12月分别置于第四季度之前。Step2:选中数据后插入初始字母饼图。Step3:右击图表,选择“设置数据系列格式",在系列选项中设置系列分割依据为”位置“,第二绘图区域中的值为”3“,对应10月、11月、12月。Step4(非常关键的一步):点击图表,修改公式。将第三个参数范围由原来的B4:B10 更改为B4:B9。最终效果如下:Step5:可以右击图表,添加数.

2021-03-23 17:23:25 14729

原创 Python pandas 重命名索引和列名称

目录1.重命名列名称2.重命名索引3.重置索引df=pd.DataFrame(np.arange(16).reshape(4,4),columns=["one","two","three","four"],index=['a','b','c','d'])1.重命名列名称df.rename(columns={"one":"nj","two":"bj"},inplace=True)2.重命名索引df.rename(index={"a":"aaa","d":"ddd"},inplace=True

2021-03-16 18:33:34 20161

原创 Python pandas 删除指定行/列数据

目录1.滤除缺失数据dropna()1)滤除含有NaN值的所有行2)滤除含有NaN值的所有列3)滤除元素都是NaN值的行4)滤除元素都是NaN值的列5)滤除指定列中含有缺失的行2.删除重复值 drop_duplicates()3.根据指定条件删除行列drop()1.滤除缺失数据dropna()import pandas as pdimport numpy as npdf=pd.DataFrame({"record":[np.nan,"亚健康|潘光|45岁","疾病|张思",np.nan],"date

2021-03-16 18:17:05 55056 4

原创 Python pandas 实现Excel分列效果

在Excel中,通过分列功能,可以实现单元格数据按照指定分隔符分列。pandas 中可以通过str.split()函数实现类似的分列效果。import pandas as pdimport numpy as npdf=pd.DataFrame(["健康|王三","亚健康|潘光|45岁","疾病|张思","重疾|刘武"],index=["one","two","three","four"],columns=["record"])#以"|"为分割符分列,返回Seriesdf["record"].s

2021-03-16 17:18:54 6048

原创 Python pandas 计算行/列数据之和

import pandas as pdimport numpy as npdf=pd.DataFrame(np.arange(16).reshape(4,4),columns=["sh","bj","sz","gz"],index=["one","two","three","four"])目录1. 对每一列求和2.对每一行求和3.DataFrame中axis=1/axis=0的区别1. 对每一列求和df.loc["sum"]=df.apply(lambda x:sum(x),axis=0)

2021-03-16 17:06:17 19154 1

原创 Python pandas 替换指定数据

目录一、构造dataframe二、替换指定数据(fillna、isin、replace)三、替换函数replace()详解一、构造dataframeimport pandas as pdimport numpy as npdf=pd.DataFrame(np.arange(16).reshape(4,4),columns=["sh","bj","sz","gz"],index=["one","two","three","four"])df.iloc[0,1]=np.nan二、替换指定数据(f

2021-03-16 15:58:18 46286 1

原创 Python pandas 根据指定条件筛选数据

1、构造dataframeimport pandas as pdimport numpy as npdf=pd.DataFrame(np.arange(16).reshape(4,4),columns=["sh","bj","sz","gz"],index=["one","two","three","four"])2、筛选出"sh"列大于5的数据法一:直接筛选,适用于一些比较简单直接的筛选,这种方式方便快捷。df[df["sh"]>5]法二:函数筛选,适用于比较复杂的条件筛选,函

2021-03-16 14:30:42 65643 2

原创 Excel作图-折线图分段显示不同颜色

需要将下表中的销量数据折线图按照不同季度分不同颜色显示。最终实现的效果如下所示:处理方式如下:Step1:添加辅助列,将四个季度的数据分别存放在对应月份下。这里需要注意的是,从第二个季度开始的辅助列,需要以上一季度的最后一个月的数据作为开头,否则折线图会存在明显的间隔,如下:Step2:设置空单元格的显示方式由于辅助列中存在空单元格,如果默认不处理的话,会出现如下所示的现象:这里需要设置空单元格的显示方式,在图表上右击选择数据-隐藏的单元格和空单元格-用直线连接数据点。最终,实

2021-03-11 23:43:05 16918

原创 Excel公式-如何给单元格中的字符串前后加上双引号

需求:给名称列中的记录均加上双引号实现方式如下:公式:=""""&A2&""""

2021-03-10 16:45:46 6353

原创 Python正则表达式之提取字符串中中文和数值

Python正则表达式之提取字符串中指定值提取中文提取数值提取整型数值提取浮点型数值提取整型和浮点型数值提取中文import repattern=re.compile("[\u4e00-\u9fa5]+")pattern.findall("士力架花生夹心巧克力全家桶460g/+40克(20克*2)500g")输出:[‘士力架花生夹心巧克力全家桶’, ‘克’, ‘克’]提取数值提取整型数值import repattern=re.compile("[0-9]+")pattern.find

2021-03-10 16:30:42 3672 2

原创 Excel操作-跳过隐藏行粘贴

一、需求将名称列所有甲的数学成绩替换成数学平均成绩二、实现方式step1、筛选出所有名称是“甲”的记录step2、将数学平均成绩复制粘贴至数学成绩列,但是一般情况下,Excel表格是无法直接跳过隐藏行粘贴的。此时可通过使用填充功能跳过隐藏行粘贴。step3、选中数学和数学平均成绩列后,点击“填充”,选择“向左填充",即可成功实现跳过隐藏行粘贴。...

2021-03-02 11:23:42 9111

原创 Excel操作-多条件筛选

一、背景一般情况下,Excel多条件筛选,可以直接打开数据栏下的“筛选”功能,然后多值勾选即可。但是如果可选项过多,通过多值勾选的方式实现多条件筛选就不现实了。这里可以通过使用“高级”筛选功能来快速实现多条件筛选。二、实例筛选出所有子分类是“饼干”或者“薄荷糖”或者“巧克力”的记录。三、操作步骤1、列出筛选值,此处需注意的是,列名要与需筛选的列名保持一致;2、全选需执行筛选的数据,点击数据操作栏下的“高级”筛选;3、填写高级筛选参数,其中列表区域为全选的筛选区域,条件区域为步骤1中列

2021-03-02 11:05:25 7073

原创 Excel公式-提取字符串中首次出现的数值

1、需求如下:提取如下记录中采访人物的年龄2、提取思路1)我们需要提取出“自我介绍”列的数值信息,即年龄信息;2)首先获取数字首次出现的位置:公式:=MIN(FIND({1,2,3,4,5,6,7,8,9,0},B2&5^19))其中5^19的值为19073486328125,该值中同时包含了从0-9的10个阿拉伯数字,B2值与5^19合并是为了确保此处FIND()函数不报错。3)我们获取了数字首次出现的位置,使用...

2021-03-01 11:08:18 3945

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除