|pandas|
数据分析利器pandas使用技巧
alexliu2360
后端/推荐系统/推荐算法
展开
-
【pandas-基础】datetime,Timestamp和datetime64之间转换
[参考链接]:https://www.cnblogs.com/nxf-rabbit75/p/11111825.html0. 引入工具包import datetimeimport numpy as npimport pandas as pdfrom IPython.display import Imagefrom IPython.core.display import HTMLImage(url= "https://i.stack.imgur.com/uiXQd.png")1.dateti转载 2022-04-05 15:42:32 · 3092 阅读 · 0 评论 -
【pandas-api】api汇总(脑图版)
需要脑图的请在评论区留言,谢谢~1. Series原创 2022-02-24 10:52:43 · 252 阅读 · 0 评论 -
CountVectorizer解决 报错empty vocabulary
在使用CountVectorizer的时候,出现了错误ValueError: empty vocabulary; perhaps the documents only contain stop words。先看下出现问题的代码:from sklearn.feature_extraction.text import CountVectorizerimport pandas as pddf = pd.DataFrame(['1 2 3 4', '2 3'])cv.fit(df[0])上述代码会报错,转载 2021-10-27 11:33:18 · 4123 阅读 · 0 评论 -
【pandas】numpy.ptp()最大值与最小值的差
numpy.ptp() 是计算最大值与最小值差的函数,用法如下:import numpy as npa = np.array([np.random.randint(0, 20, 5), np.random.randint(0, 20, 5)])print('原始数据\n'a)print('对所有数据计算\n', a.ptp())print('axis=0,按行方向计算,即每列\n', a.ptp(axis=0)) # 按行方向计算,即每列print('axis=1,按列方向计算,即每行\n',转载 2020-05-21 20:33:17 · 2275 阅读 · 0 评论 -
【Pandas】遍历pd.Series中的index和value方法
import pandas as pdtest = pd.Series([1,2,3,4,5])for i,v in test.items(): print(i, v)# 0 a# 1 b# 2 c# 3 dfor i, v in test.iteritems(): print('index: ', i, 'value: ', v)#index: 0 value: a#index: 1 value: b#index: 2 value: c#index:原创 2020-05-19 01:13:20 · 18875 阅读 · 0 评论