基于python的大数据分析与应用环境的搭建

本文介绍了如何通过Python及其数据分析工具如Numpy、Scipy和Pandas进行数据分析,包括Python开发环境(如Anaconda)的安装,Spyder的基本功能演示,以及数据的导入导出(CSV、Excel和MySQL)操作。
摘要由CSDN通过智能技术生成

一、主要目的:

初步熟悉Python数据分析工具,通过查阅相关说明文档掌握Numpy、Scipy和Pandas包的基本使用方法。对于不同形式的源数据文件,能够基于python开发环境正确的完成数据导入。

二、主要内容:

1、Python开发环境安装以及数据分析包的加载

(1)Anaconda安装过程

(2)相关第三方库的加载 如 爬虫scrapy包。

提示:

① Anaconda下载地址:

Free Download | Anaconda

② Anaconda安装参考:

https://blog.csdn.net/weixin_37766087/article/details/100742198

2、通过简要的实例代码熟悉开发环境以及数据分析包的基本功能

(1)代码实例展示Spyder的基本功能

例如:代码提示、变量浏览、图形查看

  1. 代码实例展示Pandas 中的数据结构

① Series:一维数组系列,也称序列

② DataFrame:二维表格型数据结构。可以将DataFrame理解为Series的容器。

  1. 数据的导入与导出
  1. 导入不同形式的文件,例如.txt/.csv/.excel
  2. 导出到csv/excel
  3. 导入导出MySql库[附选]

三、实验过程:

1.Anaconda安装过程

已安装

2.Spyder

① Series:一维数组系列,也称序列

DataFrame:二维表格型数据结构。

导入不同形式的文件,例如.txt/.csv/.excel
导入excle
  1. df = pd.read_excel(io='自己的文件路径',index_col='序号')  
  2. print(df)  

导出到csv/excel

Excel:

  1. writer = pd.ExcelWriter('age-name.xlsx')  
  2. df.to_excel(writer)  
  3. writer.save()  

CSV:

  1. csv_data = df.to_csv("自己的文件路径",sep='|')  

导入导出MySql库[附选]
  1. 从mysql中导出dataframe对象
  1. conn = pymysql.connect(host="localhost",port=3306,user="root",  
  2.  password="密码已经被和谐",database="school",charset="utf8")  
  3. sql = "select * from student;"  
  4. df = pd.read_sql(sql,conn)  
  5. print(df) 
  6. 导入dataframe数据到mysql
  • from sqlalchemy import create_engine  
  • engine = create_engine("mysql+pymysql://root:密码已被和谐@localhost:3306/school?charset=utf8")  
  • data = [['小明',14],['东东',18],['奥图码',53]]  
  • df = pd.DataFrame(data,columns=['姓名','年龄'])  
  • df.to_sql("try", engine, schema="try")  

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

xixixi77777

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值