1.导入csv数据
概念: csv是一种常见的数据存储格式,基本上我们遇到的数据都可以转为这种存储格式。在Python数据数据分析中,我们可以使用pandas模块导入csv数据。例子:
import pandas as pda
# csv数据导入
i = pda.read_csv('数据地址/test.csv')
i.describe() # 查看基本统计信息,返回是列里面都是数字的列,第一行默认列名
# 按照某一列,使用方法排序
i.sort_values(by="") # by等于第一行名称,为对应列进行排序
2.导入Excel数据
import pandas as pda
# xls数据导入
j = pda.read_excel('数据地址/test.xls')
3.导入MySQL数据
import pandas as pda
import pymysql
#数据库导入
conn = pymysql.connect(host='127.0.0.1', user='root', passwd='root123', db='自己的数据库')
sql = 'select *from 表名'
k = pda.read_sql(sql, conn)
4.导入html数据
使用pandas,可以直接从html网页中加载对应的table表格中的数据,但是在使用read_html()之前,需要先安装html5lib模块与 bs4模块。
import pandas as pda
h=pda.read_html('本地保存的html文件路径')
#网络
m=pda.read_html('https://book.douban.com/')
print(m)
5.导入文本数据
import pandas as pda
#文本导入
t=pda.read_table('文本地址')