MOOC用Python玩转数据笔记 2

pandas

pandas 结合Series和DataFrame的某些绘图功能,还能用pylot函数
方便从csv中读取文件
自己试过的代码:
pandas.read_csv(“*.csv”)
read_excel(“*.xlsx”, “Sheet1”) 读取表格

想试但怕麻烦的代码(主要练习DataFrame):
先将数据形成一种结构:
df = pandas.DataFrame(quotes)
再存入表格:
df.to_excel("***.xls, sheet_name="***")

做题目(增加一列sum数据):
这里写图片描述

这里写图片描述

>>> import pandas as pd
>>> exc=pd.read_excel(r"C:\Users\Administrator\Desktop\f.xlsx","Sheet1")
>>> sum = []
>>> for index, row in exc.iterrows():  
...     newone = row.Python + row.Math
...      sum.append(newone) 
>>> exc["sum"]=sum  #for循环里不写index,sum变量好像就成元组了,就会出错。
>>> exc.to_excel(r"C:\Users\Administrator\Desktop\f.xlsx","Sheet2")
最后一行报错

IOError: [Errno 13] Permission denied: 还不会解决。明天再说吧!!!貌似可以用arcpy解决。屁咧。
os.getcwd()
os.chdir()

# mydir = r'C:\Users\Administrator\Desktop'
# os.chdir(mydir)
# arcpy.env.workspace = "c:/data"  

出现的问题:

1.因为没有某个模块显示运行失败————安装相应模块(link)就行了
2.IOError: [Errno 13] Permission denied: ‘C:\Users\Administrator\Desktop\f.xlsx’ 貌似属于管理员权限问题

一直伴随的问题:


$ echo $PATH #意思是显示路径
-------
$ echo $HOME #(同$ echo ~)意思是当前用户主目录
-------
>>>os.getcwd()  #获取当前工作目录
-------
?os.path.join() #干啥用的,咋用?
-------
>>>os.environ
以下杂,作为搜索脉络吧:

http://matplotlib.org/examples/animation/animate_decay.html
聚类分析之一K均值算法

刚认识的新词:
聚类中心 均方差 测度函数 收敛

聚类算法包:
- 机器学习包scikit-learn
- 这里用SciPy.cluster.vq的kmeans()和vq()
堆积数据:vstack()

Matplotlib绘图基础
包含绘图模块
- 绘图API——pyplot模块
- 集成库——pylab(numpy,pylot中常用函数)

查看颜色和样式
import matplotlib.pyplot as plt
help(plt.plot)

文字设置

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值