整理一些Python数据类型相关的方法,备忘。
1、list to ndarray方法:
b = np.array(a)
a是list类型,b为ndarray类型。
2、查看元素类型
type(Object)
3、查看列表的维度(要先转化为ndarray类型,再查看维度)
np.array(a).shape #a为列表
4、直接获取csv文件中的某一列
df = pd.read_csv(“D:/01.csv”)
a = []
a = df.nyecpmrate #这里的nyecpmrate为csv文件中某一列的标签
#a的类型为pandas.core.series.Series
5、pandas.core.series.Series转化为ndarray类型
b = np.array(a)
b为ndarray类型,a为pandas.core.series.Series类型
6、pandas.core.series.Series类型可以直接用来做散点图折线图
import matplotlib.pyplot as plt
import pandas as pd
df = pd.read_csv("D:/01.csv")
X = df.nyecpmrate
y = df.nyfillraterate
plt.plot(X, y,'k.')
plt.show()
效果图如下:
7、ndarray to list
#定义一个numpy.ndarray
a=numpy.array([1,2,3,4,5,6])
b=array.tolist() #b为list类型
8、最大,最小,获取列表长度
max(list)
返回列表元素最大值
len(list)
列表元素个数
min(list)
返回列表元素最小值
list(seq)
将元组转换为列表
9、其他
1 list.append(obj)
在列表末尾添加新的对象
2 list.count(obj)
统计某个元素在列表中出现的次数
3 list.extend(seq)
在列表末尾一次性追加另一个序列中的多个值(用新列表扩展原来的列表)
4 list.index(obj)
从列表中找出某个值第一个匹配项的索引位置
5 list.insert(index, obj)
将对象插入列表
6 list.pop([index=-1])
移除列表中的一个元素(默认最后一个元素),并且返回该元素的值
7 list.remove(obj)
移除列表中某个值的第一个匹配项
8 list.reverse()
反向列表中元素
9 list.sort(cmp=None, key=None, reverse=False)
对原列表进行排序
10、python pandas加载.txt文件
df = pd.read_csv("path",delimiter="\t")
11、python为数据添加列标签
df.columns=['ads_info','ads_id','country','durtion','n','is_clicked','source']
12、python 删除某一列
df1 = df.drop('ads_info',axis=1)
13、python根据某元素删除整行
df2 = df1[df1.ads_id == 'ca-app-pub-2075998924432436/1327048797']
14、dataframe类型数据按某列名属性排序
dfnew1.sort_values(by='durtion')
15、多属性去重
frame=frame.drop_duplicates(['state'])
16、python保存文件
data.to_csv("data.csv")
不保存行列索引。
data.to_csv("data.csv",index=False,header=False)
16、python去噪声(通过控制值范围来实现)
data = data[data['size']<= 500]