- 博客(4)
- 资源 (15)
- 收藏
- 关注
转载 Hbase数据模型与table设计
最近在学习Hbase的使用,并仔细阅读了一篇官方推荐的博客,在这里就以一边翻译一边总结的方式和大家一起梳理一下HBase的数据模型和基本的表设计思路。官方推荐的博客原文地址:http://0b4af6cdc2f0c5998459-c0245c5c937c5dedcca3f1764ecc9b2f.r43.cf2.rackcdn.com/9353-login1210_khurana.pdf点击打开
2017-03-26 14:15:24 712
转载 Pands分组统计函数
利用Python的pandas库进行数据分组分析十分便捷,其中应用最多的方法包括:groupby、pivot_table及crosstab,以下分别进行介绍。0、样例数据[python] view plain copydf = DataFrame({'key1':['a','a','b','b','a'],'key2':['one',
2017-03-13 18:23:19 900
转载 12个使Pandas效率倍增的技巧—下
7 – 数据框合并当我们有收集自不同来源的数据时,合并数据框就变得至关重要。假设对于不同的房产类型,我们有不同的房屋均价数据。让我们定义这样一个数据框:prop_rates = pd.DataFrame([1000, 5000, 12000], index=['Rural','Semiurban','Urban'],columns=['rates'])prop_rates
2017-03-13 15:33:53 2024
转载 12个使Pandas效率倍增的技巧—上
导语Python正迅速成为数据科学家偏爱的语言,这合情合理。它拥有作为一种编程语言广阔的生态环境以及众多优秀的科学计算库。如果你刚开始学习Python,可以先了解一下Python的学习路线。在众多的科学计算库中,我认为Pandas对数据科学运算最有用。Pandas,加上Scikit-learn几乎能构成了数据科学家所需的全部工具。 本文旨在提供Python数据处理的12种方法。文中也分享了
2017-03-13 15:32:19 2181
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人