导入CSV数据
Import pandas as pd
data = pd.read_csv(“文件保存的位置”)
data.describe() # 数据的统计
data.sort_values(by=”列名”) #数据按某列排序
导入Excel数据
Excel是一种表格文件,在Python数据分析中,同样可以使用pandas模块导入Excel表格里面的数据.
data = pd.read_excel(“文件地址”)
导入MySQL数据
MySQL是一种很常见的数据库,在Python数据分析中,可以直接从MySQL中取数据.
Import pymysql
Conn = pymysql.connect(host=”ip地址”,user=”用户名”,passwd=”密码”,db=”要连接的数据库”)
Sql = “select * from 表名”
k=pd.read_sql(Sql,Conn)
导入html数据
使用pandas,可以直接从html网页中加载对应table表格中的数据,但是在使用之前read_html()之前,需要先安装html5lib模块与beautifulsoup4模块.
#读取本地网页
L = pd.read_html(“D:\大数据\sinanews\3.html”)
#直接读取网站上的表格
m = pd.read_html(“https://book.douban.com/”)
导入文本数据
n=pd.read_table(“文件保存地址”)