编译:老齐
与本文相关的图书推荐:《数据准备和特征工程》
![47ba8990f073c233f31aaa0bbe8d4ee8.png](https://i-blog.csdnimg.cn/blog_migrate/cf6da353626f07698b89105edede52f3.png)
在数据科学项目中,通常用Pandas的read_csv
或者read_excel
从相应文件中读入数据,此外,对于数据量不大的时候,可能还有下面的情形出现:
import pandas as pddata = {‘key1’: values, ‘key2’:values, ‘key3’:values, …, ‘keyN’:values}df = pd.DataFrame(data)
这里是将一个Python中的字典data
转化为了Pandas中的DataFrame对象,这样字典就作为了数据源。
上面的操作并不复杂,当然,这里演示的字典和对DataFrame的要求都是简单的情形。就一般而言,如果遇到了简单的数据源,可知通过下面的三步实施:
确定数据
要留言数据的格式,从而确定是否能够用于本文所说的过程。比如下面的数据: