如果你想要利用python来学习数据分析和机器学习,你将很有可能使用非常强大的Pandas库。Pandas是python的一个可供数据操纵和分析的开源库。今天的内容是小编带你对Pandas进行简单的入门。
1 读取数据
这有一种很简单的方式,就是你可以用Python加载数据表(tables)以及excel文件:
Pandas可以让我们读取电子表格并且用python程序化地操纵它们。
Pandas的核心是DataFrame——基本上是一个数据表,每个行和列都有一个label。
现在先让小编演示如何读取一个包含音乐服务数据的基本CSV文件。
import pandasdf=pandas.read_csv('music.csv')
read_csv函数可以把轻松地把数据搬到DataFrame里。同学们还要注意修改括号里文件的路径。
接下来就可以对数据进行切分用来分析了。
2 选择数据
根据它的label选择任意一列:
df['Artist']
![6d874116e418f45aa5cf638c573429f9.png](https://i-blog.csdnimg.cn/blog_migrate/412cb8c3ee4026e34e0b001baadb84c6.jpeg)
也可以使用它的行号来选择一行或者多行:
df[1:3]