python
文章平均质量分 64
Ryan_Yang_
这个作者很懒,什么都没留下…
展开
-
【python学习笔记】Dataframe和类SQL的merge函数(一)
因为公司的服务器没有R,所以R现在只能是单机玩家;为了处理更大体量的数据,开始看看python。据说python有SQL相关的包,还有之前随便看的beautifulsoup的爬虫,可以说python可以做的事情太多了。但是首先focus on数据分析,这块和R可以对比着看,看看两种语言的逻辑和差异。最近在看《利用python进行数据分析》,据说是pandas的创始人写的,实话实说,这本书的可读性较《原创 2017-06-29 17:58:08 · 1924 阅读 · 0 评论 -
【python学习笔记】Dataframe和类SQL的merge函数(二)
上一篇文章中提到的merge函数,也就是类似于SQL的join方法中,主要的参数是on参数;除了on参数,还有专门针对index join的参数:index;可以理解成是左边的一列和右边的索引进行连接,想了想,R中应该是data.table有这种便利的函数,其实我更喜欢直接用SQLDF包;书中的例子是:left1=DataFrame({'key':['a','b','a','a','b','c'],原创 2017-07-01 10:54:15 · 1096 阅读 · 0 评论 -
【R和Python对比】matplotlib和ggplot(一)
接下来几天对比下R和py的作图功能。R的ggplot可以说是各方面都很优秀的作图包,具有优雅的语法结构、多参数可变的调整和丰富的作图模式,然而ggplot学习起来较为复杂,而且在画图之前需要做一些繁琐的数据整形和处理工作,因为ggplot只接受长格式的数据,所以意味着需要把宽格式变长。同样的,python的画图工具也有这个问题,不过更多的是把长数据变成宽数据,这两个画图还真的是配呢。py的主要工具就原创 2017-07-13 11:47:29 · 6483 阅读 · 1 评论 -
【python】Scrapy安装
最近准备入scrapy的坑,因为还是相对比下py和R的爬虫机制,但是安装scrapy包简直让我费劲死了,在上stackflow查了好多因素后,终于成功安装了 ;我的环境是pycharm,在setting里直接搜索是会出现问题,提示C++14.0 required也就是需要安装C++,这时候去网站上下载visual studio2017,官网,下载的是一个小的安装程序。 https://www.v原创 2017-07-22 10:28:22 · 697 阅读 · 0 评论 -
【R和Python对比】matplotlib和ggplot(三)
不得不说,matplot感觉就是R中的plot,简单上手,但是扩展不足,而且偶然发现了python也有ggplot包,但是由于C++的问题无法安装,后续再研究下。先看下高级的散点图,类似R的:geom_point(aex(x,y),color=z)也就是说针对不同的种类进行颜色填充,依靠之前的说法,因为matplot图形做的事情很少,需要借助数据整形。而这个时候应用到了python的map函数,ma原创 2017-07-18 17:28:06 · 2880 阅读 · 0 评论