pandas和numpy的使用

最新推荐文章于 2024-09-07 23:12:59 发布

rui_x_knight

最新推荐文章于 2024-09-07 23:12:59 发布

阅读量1.7k

点赞数

分类专栏：机器学习 python 文章标签： numpy pd

本文链接：https://blog.csdn.net/rui_x_knight/article/details/71108064

版权

机器学习同时被 2 个专栏收录

2 篇文章 0 订阅

订阅专栏

python

2 篇文章 0 订阅

订阅专栏

总结一下自己最近学习过程中，使用到的pandas和numpy操作，后面学习过程再慢慢补充：

pandas

import pandas as pd
# read file
df_csv = pd.read_csv(path)
#for txt file without header
df_txt = pd.read_table(path, header = None)
#切片
df.ix[col] #get one column as series
df.ix[[cols]] #get columns as df

#check info
df.head()
df.tail()
df.sample(10) #randomly pick 10 rows in df
df.describe() #summary statistics **for numerical columns**
df.info() #check index data type and memory info

numpy

import numpy as np
np.count_nonzero(a) #count the nonzeros in numpy array a
np.tile(A, N) #copy array A N times;N can be two dimensions
np.argmax(array, axix=1) #返回最大元素的index
np.loadtxt() #Each row in the text file must have the same number of values
np.genfromtxt(filepath， fillingvalue=) #可以处理文件中有缺失值的情况，默认缺失值被替代为nan，可以通过fillingvalue改变缺失值的替换