python
予亭
活泼开朗,爱好广泛。
展开
-
python 编程小技巧
2的n次幂<< 是最快的执行方法,移位操作符。In [613]: %timeit 1 << 10The slowest run took 78.83 times longer than the fastest. This could mean that an intermediate result is being cached.100000000 loops, ...原创 2019-10-21 22:47:25 · 222 阅读 · 0 评论 -
python jieba 结巴分词报错 AttributeError: 'module' object has no attribute 'cut'
首先这个AttributeError: ‘module’ object has no attribute ‘cut’ 报错的原因是因为有jieba.py这个文件存在,或者jieba这样命名的文件存在,很多新人使用结巴 来分词的时候命名直接为jieba.py,但是其实官方给的教程代码里有import jieba,这样就会引用到你自己这个教程文件jieba.py,而没有引用官方的库,所以报错。原创 2017-06-29 20:50:29 · 15496 阅读 · 6 评论 -
python处理时间
前言处理时间真是苦不堪言,自己来做还是比较复杂的,利用代码来切割"2019-06-08 12:12:12"等等这样的数据集,比如,按照10分钟来切割,10分钟一个间隔,对数据集中的这些数据处理,很令人费劲,最简单就把时间格式切割,我觉得不合适。解决方法通过pd.to_datetime来处理时间,这样获取时分秒就太简单了,完全很方便data29=pd.read_csv(r"testA_sub...原创 2019-06-08 00:32:08 · 489 阅读 · 0 评论 -
python对一列数据多次统计(sum、count)
前言对数据进行统计,特别是多次统计可能要写多行,想偷懒,于是发现了这个方法。解决方法 # 下面通过 agg 来对status的两个变量分别统计,其实进站出站度可以count # 1、sum 这个变量的总值 ,赋值给sum这一列 # 2、count 这个变量group之后的记录的数量,赋值给count data1= data.groupby(['time_hour...原创 2019-06-08 09:43:55 · 13555 阅读 · 3 评论