数据分析打工人常用NumPy 70个高频操作(下篇)

本文详细介绍了70个在数据分析工作中经常使用的NumPy操作,包括计算数组相关系数、检查缺失值、值替换、频率计算、类型转换、行列操作、抽样、排序、排名、统计计算、图像转换等,覆盖了数据分析的多个方面。
摘要由CSDN通过智能技术生成

 

目录

36、求numpy.ndarray两列相关系数

37、判断numpy.ndarray中是否有null值

38、使用指定值替代numpy.ndarray中的缺省值

39、计算numpy.ndarray元素频率

40、将numpy.ndarray元素由数值型转换为分类型

41、由numpy.ndarray已知列得到新列

42、numpy.ndarray概率抽样

43、numpy.ndarray按某个指标分类后求第二大的元素

44、通过numpy.ndarray某一列排序

45、挑选numpy.ndarray中频数最高的元素

46、输出numpy.ndarray中第一次大于给定元素的位置

47、使用给定值替换numpy.ndarray中满足条件的元素

48、获取numpy.ndarray中大小排前n的元素位置、元素

49、求numpy.ndarray的row wise counts

50、多个numpy.ndarray合成一个

51、计算numpy.ndarray的one-hot encodings numpy.ndarray

52、create row numbers grouped by a categorical variable

53、create groud ids based on a given categorical variable

54、numpy.ndarray(一维)元素rank

55、numpy.ndarray(多维)元素rank

56、输出numpy.ndarray每行的最大元素

57、输出numpy.ndarray每行的最小值与最大值比值

58、判断numpy.ndarray中元素是否是第一次出现

59、求numpy.ndarray中每组元素的均值

60、将PIL image转换为numpy.ndarray

61、丢弃numpy.ndarray中所有缺省值

62、计算两个numpy.ndarray的欧几里得距离

63、求numpy.ndarray的局部最大值位置

64、numpy.ndarray减法运算

65、输出numpy.ndarray中元素第n次重复的位置

66、numpy.ndarray数据格式从datetime64转换为datetime

67、计算numpy.ndarray数据窗口大小

68、指定起始、终止、步长,构建numpy.ndarray

69、补齐非连续时间序列numpy.ndarray

70、构建按指定步长滑窗的numpy.ndarray


36、求numpy.ndarray两列相关系数

url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data'
iris = np.genfromtxt(url, delimiter=',', dtype='float', usecols=[0,1,2,3])

#方法1
np.corrcoef(iris[:, 0], iris[:, 2])[0, 1]

#方法2
from scipy.stats.stats import pearsonr  
corr, p_value = pearsonr(iris[:, 0], iris[:, 2])
print(corr)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

qq_21478261

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值