自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 【利用Python进行数据分析——经验篇4】将多张DataFrame表写入到同一个Excel的不同sheet中

# 创建一个输出文件writer = pd.ExcelWriter('out.xlsx')data = pd.read_table('table_All_pivot.csv',sep=',')data.to_excel(writer,'table_All_pivot',index=False)sf_All = pd.read_table('sf_All.csv', sep=',' )sf_All....

2017-06-29 11:20:41 22587 8

原创 【利用Python进行数据分析——经验篇3】如何操作DataFrame中的列的数据格式(转为百分数、保留4位小数)

本文中案例以【利用python进行数据分析——基础篇】利用Python处理和分析Excel表中数据实战的实战数据为例备注:本文操作是使用ipython notebook进行的编译# 将DataFrame表中的浮点类型保留至小数点后四位# 自定义函数保留到小数点后四位f = lambda x: '%.4f' % x# 将aa 表的第21列到末尾的列的数据格式都保留到小数点后四位aa.ix[:,21:...

2017-06-28 20:21:07 10567 1

原创 【利用Python进行数据分析——经验篇2】计算微博转发/评论/点赞h指数的Python代码

本文中记录了如何得出h指数的计算值微博转发/评论/点赞h指数:(定义),某博主如果他/她发表的N篇博文中有h篇每篇至少被h次转发/评论/点赞,而剩下的(N-h)篇博文中每篇被转发/评论/点赞次数均少于h次,则数值h则表示的是这个微博的转发/评论/点赞h指数。备注:本文中使用的是ipython交互式编辑器本文中案例以【利用python进行数据分析——基础篇】利用Python处理和分析Excel表中数...

2017-06-28 20:05:06 2855

原创 【利用Python进行数据分析——经验篇1】将Excel表中几列合并到一列中

我们都知道,在Excel中可以很容易实现,采用‘A1&B1’ 或者利用CONCATENATE(A1&B1)方式可以实现,但是在Python的pandas包中,本人没有找到合适的用于连接表中两列的函数,因此本人使用了字符串连接的方式。本文中案例以【利用python进行数据分析——基础篇】利用Python处理和分析Excel表中数据实战的实战数据为例首先查看该表格中各个列中的数据类型:...

2017-06-28 19:20:09 14730 1

原创 【利用python进行数据分析——基础篇】利用Python处理和分析Excel表中数据实战

作为一个学习用Python进行数据分析的新手来说,通过本文来记录分享一些我在用Python中的pandas、numpy来分析Excel表中数据的数据清洗和整理的工作,目的是熟悉numpy以及pandas基础操作,所有操作利用Excel均可以方便实现。备注:本文中使用的是ipython完成的编辑数据来源及结构  本文所分析的数据是通过爬虫抓取的微博数据。选取新浪微博为数据平台,选取我国34个省的旅游...

2017-06-28 15:09:32 130443 29

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除