写在前面
从本周开始准备挖个新坑——Excel VS Python
Excel是最基础、最常用的数据分析工具软件
Python则是最热门、最实用的数据分析编程语言
这个专题的推文将主要介绍如何通过使用Excel 和Python来实现一套较完整的数据分析流程,分析结果可用于统计分析、报告或课题的撰写
另外 ,结合每2-3期的推文内容会为大家安排一次相应的直播或录播课程
知识点1:读取Excel文件数据
基本方式1
import pandas as pd #载入pandas库
data = pd.read_excel('C:/Users/dell-pc/Desktop/data.xlsx')
data.head(10) #显示前10行数据
基本方式2
data = pd.read_excel('C:\\Users\\dell-pc\\Desktop\\data.xlsx')
data.head(10) #显示前10行数据
基本方式3
data = pd.read_excel(r'C:\Users\dell-pc\Desktop\data.xlsx')
data.head(10) #显示前10行数据
读取指定Sheet的数据
data = pd.read_excel('C:/Users/dell-pc/Desktop/data.xlsx', sheet_name = "data01")
data.head(10) #显示前10行数据
读取某几列的数据1
data = pd.read_excel('C:/Users/dell-pc/Desktop/data.xlsx', usecols = [0, 2]) #读取第1和第3列数据
data.head(10) #显示前10行数据
data.shape[1] #显示数据集的列数
读取某几列的数据2
data = pd.read_excel('C:/Users/dell-pc/Desktop/data.xlsx', usecols = 'A:C') #读取第1到第3列数据
data.head(10) #显示前10行数据
data.shape[1] #显示数据集的列数
读取前几行的数据
data = pd.read_excel('C:/Users/dell-pc/Desktop/data.xlsx', nrows = 100) #读取前100行数据
data.head(10) #显示前10行数据
data.shape[0] #显示数据集的行数
知识点2:读取CSV文件数据
基本方式
data = pd.read_csv('C:/Users/dell-pc/Desktop/data01.csv')
data.head(10) #显示前10行数据
读取特定分隔符的CSV文件数据
data = pd.read_csv('C:/Users/dell-pc/Desktop/data02.csv', sep = ';')
data.head(10) #显示前10行数据
读取某几列的数据
data = pd.read_csv('C:/Users/dell-pc/Desktop/data01.csv', usecols = [0, 2]) #读取第1和第3列数据
data.head(10) #显示前10行数据
data.shape[1] #显示数据集的列数
读取前几行的数据
data = pd.read_csv('C:/Users/dell-pc/Desktop/data01.csv', nrows = 100) #读取前100行数据
data.head(10) #显示前10行数据
data.shape[0] #显示数据集的行数