一、Pandas中Series()和DataFrame()的区别与联系
from:https://blog.csdn.net/missyougoon/article/details/83301712
区别:
series,只是一个一维数据结构,它由index和value组成。
dataframe,是一个二维结构,除了拥有index和value之外,还拥有column。
联系:
dataframe由多个series组成,无论是行还是列,单独拆分出来都是一个series。
二、Pandas Series 和 Numpy array中的区别与联系
区别:
from:https://zhuanlan.zhihu.com/p/34905793
Series就是带索引(index)的一维array,开头的S必须大写。
Series是不一定是数值型,可以是字符串;array必须是数值型。
联系:
https://blog.csdn.net/chuan403082010/article/details/79428415
可以利用中括号获取元素 s[0]
可以的得到单个元素 或 一个元素切片 s[3,7]
可以遍历 for x in s
可以调用同样的函数获取最大最小值 s.mean() s.max()
可以用向量运算 <1 + s>
和Numpy一样, Pandas Series 也是用C语言, 因此它比Python列表的运算更快
三、Python中列表list,元祖tuple和numpy中的array区别
from:https://www.jb51.net/article/138376.htm
1.列表
数据结构:list是处理一组有序项目的数据结构,即你可以在一个列表中存储一个序列的项目。
表示形式:列表中的项目应该包括在方括号中,这样python就知道你是在指明一个列表。
列表可变、可嵌套:列表可以增加或删除项目,是可变的数据类型,即这种类型是可以被改变的,并且列表是可以嵌套的。(append和del函数)
2.元组
数据结构:元祖和列表相似
表示形式:元组通过圆括号中用逗号分隔的项目定义。
元祖不可变:元组是不可变的,你不能修改元组。元组可以嵌套。(元组通常用在使语句或用户定义的函数能够安全的采用一组值的时候,即被使用的元组的值不会改变。)
3.数组(array)
数据类型相同:numpy中封装的array有很强大的功能,里面存放的都是相同的数据类型; list中的数据类不必相同的,而array的中的类型必须全部相同。
在list中的数据类型保存的是数据的存放的地址,简单的说就是指针,并非数据,这样保存一个list就太麻烦了,例如list1=[1,2,3,‘a’]需要4个指针和四个数据,增加了存储和消耗cpu。
四、Python中DataFrame\ array\ list相互转化
https://www.cnblogs.com/Christina-Notebook/p/10100903.html
五、Python中将多个列表转成DataFrame
https://blog.csdn.net/tanlangqie/article/details/80874866
Python中将列表转换成为数据框有两种情况:第一种是两个不同列表转换成一个数据框,第二种是一个包含不同子列表的列表转换成为数据框。
六、Pandas进阶修炼120题https://blog.csdn.net/SeizeeveryDay/article/details/105548943
1、DataFrame的创建方法:
https://www.cnblogs.com/yqpy/p/8338032.html
2、DataFrame中df[‘pay’]和df.pay的区别,结果看是一样的?没想清楚
data = {'name':['Wangdachui','Linling','Niuyun'],'pay':[4000,5000,6000]}
df=pd.DataFrame(data)
print(df['pay'])
print(df.pay)
3、Python pandas 数据框的str列内置的方法详解
https://blog.csdn.net/tbkken/article/details/84823059