Python适合做哪种数据分析?①数据指的是
结构化数据,即:“一维数组或二维数组”,也可以这样理解:“二维数组是1个表格,一维数组是它的某1列”;②分析指的是对微观数据进行
数学统计,获得宏观的结果;python使用pandas库做数据分析。
pandas给数据分析提供了哪些支持?①针对数据,提供了2种
数据类型:
Series和
DataFrame,分别描述列和表格;②针对分析,提供了
sql统计查询、以及
链式调用函数,它们基于Series和DataFrame做运算
pandas支持读写哪些类型的存储介质?在数据分析之前,我们要
读取数据,并转换成pandas提供的数据类型:Series或DataFrame;在数据分析之后,我们要
存储结果,将Series或DataFrame数据写入存储介质。基础库中提供的数据 读写方法比较繁琐,pandas提供了更简洁的方式,本文关注下面3种常用的存储介质:①内存中的list和dic② excel文件③ sqlite3数据库
相关python库
①基础库是 pandas
②读写excel需要 openpyxl
pip install pandas openpyxl 安装数据分析用到的库
1.pandas数据读写
①在内存中,二维数据有2种组织方式:按行组织的字典列表、按列组织的列表字典,它们都可以与DataFrame相互转换。
import pandas as pd# 1)按行组织data1 = [{
'name': 'test1', 'age': 30, 'sex': 1}, {
'name': 'test2', 'age': 25, 'sex': 0}, {
'name': 'test3', 'age': 40, 'sex': 1}, {
'name': 'test3', 'age': 50, 'sex': 0}]# 2)按列组织data2 = {
'name': ['test1', 'test2', 'test3