大家都知道数据库有groupby函数,今天给大家讲讲dataframe的groupby函数。
groupby函数
还是以上文的数据为例子,进行讲解,首先读入数据,通过groupby聚合数据。(该数据为简书it互联网一段时间的文章收录信息)import pandas as pd
import pymysql
conn = pymysql.connect(host='localhost', user='root', passwd='123456', db='test', port=3306, charset='utf8')
jianshu = pd.read_sql('select * from jianshu1',conn)
group_user = jianshu.groupby('user')
group_user.groups
可以看出返回的有用户id和所在的索引位置以及数据类型。通过下面代码计算有多少用户。len(group_user.groups)
#result 543
通过size方法进行统计显示:size_user = group_user.size()
size_user
进行排序,取前十的用户。sort_user = size_user.sort_values(ascending=False)
sort_user[0:10]
highcharts绘图import charts
series = [{'name': 'Apple','data': [10],'type': 'column'},{'name': 'Android','data': [5],'type': 'column'},{'name': 'Other','data': [5],'type': 'column'}]
charts.plot(series,show='inline')
我们需要把数据整合为highcharts能识别的数据结构,然后进行绘制。series1 = []
for i in a.index:
data = {
'name':i,
'data':[a[i]],
'type':'column'
}
series1.append(data)
charts.plot(series1,options=dict(title=dict(text='投稿前十用户')))
这里的a是前十的用户数据,也就是sort_user[0:10]。
最后祝愿全天下母亲节日快乐
长按二维码向我转账
受苹果公司新规定影响,微信 iOS 版的赞赏功能被关闭,可通过二维码转账支持公众号。
阅读
好看
已推荐到看一看
你的朋友可以在“发现”-“看一看”看到你认为好看的文章。
已取消,“好看”想法已同步删除
已推荐到看一看
和朋友分享想法
最多200字,当前共字
发送
已发送
朋友将在看一看看到
确定
分享你的想法...
取消
分享想法到看一看
确定
最多200字,当前共字
发送中
网络异常,请稍后重试
微信扫一扫
关注该公众号