记录日记2021-11-12

1.python3中判断字符串是否为冲空格则称的方法

利用isspace()放法进行判断

s = '   '
s.isspace()
#去除左右两端空格
s.strip()
2.筛选dataframe中某一列包含某些字符串
df[df['地址'].str.contains('北京')]
#原来python和java一样,拥有contains方法
#或者采用dataframe中的filter方法
df_filter = df.filter(regex='abc')
3.dataframe取并集/合计/差集
# 取交集:既在df1中,也在df2中
intersection_result = pd.merge(df1, df2)
print(intersection_result)

# 取合集:df1和df2所有数据的集合
union_result = pd.merge(df1, df2, how='outer')
print(union_result)

#取差集 在df1中但不在df2中的
df1 = df1.append(df2)
df1 = df1.append(df2)
differenct_set_result = df1.drop_duplicates(['id'],keep=False)
print(differenct_set_result)
4.pandas中的dropna
df.dropna(how='all') #将所有数值均为空的行删除
df.dropna(how='all',axis=1) # 将所有数据均为空的列删除
df.dropna(thresh=2) #一行中最多有两个NaN,否则删除
5.python高级可视化库plotly express使用教程(太多了)

python高级可视化库

6.ipykernel简介

对于不同环境的内核,如果您希望为不同的虚拟机或者conda环境设置很多个ipython内核,则需要为KelnScript指定唯一的名称

7.获取int和float类型的最大值
#获得int类型的最大值
import sys
MAX_INT = sys.maxsize
print(MAX_INT)
#float最大值
max_float = float('inf')
#float最大值就是inf
8.判断字典中某个键是否存在
#我属实是没想到python能这么方便,可以直接用in 
if 'key' in dict:
    print('yes')
if 'key' in dict.keys():
    print('yes')
9.统计python列表元素出现的次数
result = {}
for i in set(list):
    result[i] = list.count(i)
10.数组拼接
#chain方法过于繁琐,对于少量数据可以采用以下方法拼接(两个列表)
a = [1,2]
b = [3,4]
a.extend(b)
11.xz后缀文件

后缀名为xz的这种文件是使用tar打包后再压缩生成的
解压:
xz -d *.tar.xz

12.pandas分箱

pd.cut是对数据进行分箱工作,这里
介绍的很详细

13.matplotlib-legend位置属性的loc使用
字符串名称代码
best0
upper right1
upper left2
lower left3
lower right4
right5
center left6
center right7
lower center8
upper center9
center10
  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值