- 博客(9)
- 资源 (1)
- 收藏
- 关注
原创 python画饼图
from pylab import mpl#显示中文,在Spyder下有效,在linux的jupyter notebook上无效,因为该机器为内网机器,没有SimHei.ttf语言包mpl.rcParams['font.sans-serif'] = ['SimHei']import matplotlib.pyplot as plt labels = [u'215V<=电压...
2019-10-29 17:55:55 1606
原创 DataFrame某一列按照条件筛选,另一列赋值
--电压小于95V或者大于110V并且是三相三线的数据vol_if_exception设置为1--判断条件无论大小一定要用括号括起来,不然会报错df.loc[((df.vol_avg_daily < 95) | (df.vol_avg_daily > 110)) & (df.wiring_mode == '2'), 'vol_if_exception'] = 1...
2019-10-29 16:47:08 17336 1
原创 DataFrame时间加减一段时间
--加一天df['data_date'] + pd.Timedelta(days=1)--减一天df['data_date'] - pd.Timedelta(days=1)
2019-10-29 11:22:15 7727
原创 python假设检验是否符合正态分布
ks检验特点是比较严格,基于的原理是CDF,理论上可以检验任何分布。from scipy.stats import kstest--data为数据集,μ为data的均值,δ为data的标准差kstest(data, 'norm', (μ,δ))Shapiro检验专门用来检验正态分布。from scipy.stats import shapiroshapiro(d...
2019-10-28 17:37:51 2974
原创 偏度和峰度
参考博文https://support.minitab.com/zh-cn/minitab/18/help-and-how-to/statistics/basic-statistics/supporting-topics/data-concepts/how-skewness-and-kurtosis-affect-your-distribution/
2019-10-24 17:41:58 882
原创 hivesql执行不动(锁表)
一,场景 在执行insert into或insert overwrite任务时,中途手动将程序停掉。后续再执行任务,哪怕任务非常简单也会出现卡死情况(无法提交MapReduce),无论执行多久,都会保持卡死状态。二,原因 hive表被锁或者某个分区被锁,需要解锁三,解决办法(1)重新再建一张不同表名的表(2)给表或者分区解锁1,首先查看锁表...
2019-10-22 16:33:32 2167
原创 使用pyhive模块往hive中写入数据,通过impala查询不到数据,通过hive客户端可以查到数据
在这种情况下,使用impala查询需要刷新元数据,把元数据信息统计到impala元数据存储中,再做查询。//重新加载所有库中的所有表INVALIDATE METADATA//重新加载指定的某个表INVALIDATE METADATA [table]...
2019-10-12 11:23:39 784
原创 Oracle查询中文乱码
是由于PLSQL客户端使用的编码和服务器端编码不一致,导致的乱码。1、查看服务器端编码Select userenv('language') from dual;我实际查到的结果为: AMERICAN_AMERICA.UTF8(每人查到的可能不一样)2、执行语句 select * from V$NLS_PARAMETERS查看第一行中PARAMETER项中为NLS_LANGUAGE对应的...
2019-10-11 16:55:29 4881 2
MxNet预编译版本下载
2017-10-10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人