网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
1.DataFrame在Pandas中用于表示矩阵数据
DataFrame包含了已排序的列集合,每一列可以是不同的值类型(数值/字符串/布尔值等)。DataFrame可以理解为一个共享相同索引的Series的字典,DataFrame既有行索引index,也有列索引colums。
2.如何构建DataFrame
data = {'name': ['wang', 'li', 'zhang'], 'gender': ['M', 'F', 'M'], 'age': [12, 13, 14]}
df = pd.DataFrame(data)
df1 = {'age':np.arange(3)}
df2 = {'name':df['name'][:-1],}
df3 = {'name':pd.Series(['D', 'A', 'E'])}
利用嵌套字典构建DataFrame时,Pandas将字典的键作为列索引,将内部字典的键进行行索引。
d = {'name': {1: 'wang', 2: 'li', 3: 'zhang'}, 'gender': {1: 'M', 2: 'F'}, 'age':{1: 12, 2: 13, 3: 14 }}
dd = pd.DataFrame(d)
print dd
输出:
age gender name
1 12 M wang
2 13 F li
3 14 NaN zhang
3.检索DataFrame
若DataFrame数据量太大,可以用df.head()筛选出最前面的五行。选择一列:类似字典的标记,如df’name’,列名为属性,如df.name(列名是有效的Python变量名)。选择一行:可以使用属性loc返回一个Series对象。如df.loc[1],其索引的名字即为当前行的列索引“1”,索引名为各列的名字。
4.通过列修改数据
d = {'name': {1: 'wang', 2: 'li', 3: 'zhang'}, 'gender': {1: 'M', 2: 'F'}, 'age':{1: 12, 2: 13, 3: 14 }}
dd = pd.DataFrame(d)
# 标量值
dd.age = 16
# 值数组(长度必须匹配)
dd.age = [60, 61, 30]
# Series对象
dd.age = pd.Series([32, 31, 30], index=[3, 2, 1])
print dd
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!**