- 博客(5)
- 收藏
- 关注
原创 python中datetime操作
import datetime, calendar date = datetime.datetime.now() 获取的为当前系统时间#1、返回昨天日期def getYesterday(): today=datetime.date.today() oneday=datetime.timedelta(days=1) yesterday=to
2017-05-13 20:16:36
675
原创 Hbase shell 命令
Hbase表结构如图:列族中可以动态的添加列,只有内容的才会占空间。Hbase是通过region来分布式存储的,按数据的字典顺序排序,如10,113,12,135,2,255,35。。。当一个region中的数据量增加特别大的时候,region server会切成两个region,然后Hmaster可以分给其他的机器分担压力。常用命令如下:进入hbase命令行
2016-10-31 10:52:44
394
原创 sklearn中随机森林的参数
一:sklearn中决策树的参数:1,criterion: ”gini” or “entropy”(default=”gini”)是计算属性的gini(基尼不纯度)还是entropy(信息增益),来选择最合适的节点。2,splitter: ”best” or “random”(default=”best”)随机选择属性还是选择不纯度最大的属性,建议用默认。3
2016-09-17 13:42:15
16593
2
原创 Python中pandas函数操作数据库
python强大的处理数据的能力很大一部分来自Pandas,pandas不仅限于读取本地的离线文件,也可以在线读取数据库的数据,处理后再写回数据库中。pandas主要是以sqlalchemy方式与数据库建立链接,支持Mysql、postgresql、Oracle、MS SQLServer、SQLite等主流数据库。一:创建链接数据库引擎from sqlalchemy impor
2016-09-09 16:49:58
34286
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人