【月度总结】数据库&Python&Excel_202206

bingbangx

已于 2022-07-13 10:51:38 修改

阅读量308

点赞数

分类专栏：语言积累文章标签： python 数据库

于 2022-07-04 11:50:48 首次发布

本文链接：https://blog.csdn.net/bingbangx/article/details/125597021

版权

语言积累专栏收录该内容

2 篇文章 0 订阅

订阅专栏

Excel

1、将表格变为超级表

实现方法：Ctrl+T

功能:当有新的数据时，数据图形得到及时更新

2、创建透视表

Alt + D +P

3、动态图表

https://jingyan.baidu.com/article/5225f26bb4e00ee6fb090811.html

4、index函数

语法：index(reference，row_now,column_num,area_num)

参数：

reference：必需，对一个或多个单元格的引用。

row_num：引用中某行的行号，函数从该行返回一个引用。

column_num：可选，引用中某列的列标，，函数从该列返回一个引用。

area_num：可选，选择一个引用区域，从该区域中返回row_num和column_num的交集

5、“相差天数”后面输入：=DATEDIF(C5,C6,"D")，

注意：其中，C5为开始日期，C6为结束日期，D则为计算日差。

数据库

1、可以向数据库表中，指定的列添加数据

insert into sku_data (sku,cw_type) values (%s,%s)

Python

1、利用python 对分组排序：

按照旺旺号，订单号，金额进行分组，并按付款时间进行排序

data1['ranks'] = data.groupby(['旺旺号','订单号','商品金额'])['付款时间'].rank().astype(int)

2、利用Python构建双层索引，并将双层变成一层。

data2 = pd.pivot_table(data1,values = ['商品金额'],index = ['旺旺号','付款时间'],columns =['ranks'])

data2.columns.tolist()

#对列名重命名

data2.columns =[str(s1) +"第"+str(s2)+"次" for (s1,s2) in data2.columns.tolist()]

data2.reset_index(inplace =True) #重置索引，然后拉平索引

3、分布密度图，可视化制图方法：sns.distplot()

辅助线制图方法：plt.axvline()

4、将占比转为把百分比的形式

bk_std_fsl['订单占比'] = bk_std_fsl['订单数'].apply(lambda x: '%.2f%%' % (x / bk_std_fsl['订单数'].sum() * 100))

5、去掉缺失值

data.dropna(inplace = True) # 去掉缺失值

6、python pandas去掉重复项

删除所有重复项：

df.drop_duplicates(inplace = True)

Remember: (inplace = True) 将确保该方法不会返回一个新的DataFrame，但是它将从原始DataFrame中删除所有重复。

7、将多种类型数据进行替换

例如将DataFrame中的空值，某些字符串等全都替换成0

replace([na.nan,'无数据','无数'],0,inplace = True)

8、转置

data.T

9、numpy.concatenate()方法

numpy提供了numpy.concatenate((a1,a2,a3,……),axis =0)，能够一次完成多个数组的拼接，其中a1,a2,a3是数组类型的参数。

a = np.array([2,3,4])

b = np.array([11,22,22])

c = np.array([55,88,99])

np.concatenate((a,b,c),axis =0) #默认情况下，axis=0可以不写

array([ 2, 3, 4,11, 22, 22, 55, 88,99]) #对于一维数组拼接，axis的值不影响最后的结果。