![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
pandas
文章平均质量分 60
王负剑!王负剑!
这个作者很懒,什么都没留下…
展开
-
pandas 替换某一列指定值 和 pd.DataFrame 报错:ValueError: Shape of passed values is (1, X), indices imply (X,X)
使用pandas替换一列中的特定值,如我想将是否违规列的‘违法’ 替换为‘违规’:方法一:df['列名'].loc[df['列名']=='a'] = 'b',简单粗暴直接检索替换。方法二:df['列名'] = df['列名'].replace['a','b'] 想从数组创建DataFrame,本意是按行插入,但是报错ValueError: Shape of passed value...原创 2018-12-05 15:35:35 · 9673 阅读 · 0 评论 -
pandas value_counts 和value_counts()的区别
value_counts(values, sort=True, ascending=False, normalize=False, bins=None, dropna=True) Compute a histogram of the counts of non-null values. Parameters ---------- values : ndar...原创 2018-12-14 17:00:38 · 6148 阅读 · 0 评论 -
pands 使用unstack和nunique()统计 同一id下某类出现的次数
灵活使用unstack和nunique真的是相当的强大,遇到了统计套牌车的一个需求。第一部我们使用分组函数统计车牌号,并将其展开成一个映射表,统计出现次数,使用unstack(0)是指将第几个列名抬上去,由双主键变为一列,一序号。cartype = df.groupby(['车牌号', '车型'])['车型'].count().unstack(level=0)unstack前车牌...原创 2018-12-14 17:25:02 · 629 阅读 · 0 评论 -
pandas使用小技巧--那些不为注意的默认参数
1.按行插入aa =pd.DataFrame([1,2,3])aa 00 11 22 3 aa.append([4]) 00 11 22 30 4 aa.append([4],ignore_index=True) 00 11 22 33 42.定位到某行某列aa.at[0,0]13.写入csv不带in...原创 2018-12-27 13:33:25 · 410 阅读 · 1 评论 -
python实现基于物品的隐式协同过滤,使用movielens数据集测试
# 在distance里我们使用的主要是基于用户的协同过滤,但是这样存在两个主要的问题# 1.扩展性问题,随着用户量变多计算量也会增长,当上百万用户时扩展性就会成为一个问题# 2.稀疏性,稀疏性,例如网上有上百万本书,用户评价过的只占一小部分,所以可能找不到最近邻居# 因此,可以使用基于物品的过滤# 调整余弦分布 减去了用户的平均评分# consine(item1,item2) = 用户...原创 2018-12-27 13:37:44 · 1886 阅读 · 0 评论 -
使用字典创建DataFrame 报错if using all scalar values,you must pass an index
1.从字典创建DataFrame 报错if using all scalar values,you must pass an indexmy_dict ={1:'zhangsan',2:'lisi',3:'wangwu'}pd.DataFrame.from_dict(my_dict)应加入pd.DataFrame.from_dict(my_dict,orient='index')...原创 2018-12-27 16:44:06 · 2430 阅读 · 0 评论 -
pandas数据处理:处理标签类型数据
Pands在进行数据处理是往往会遇到标签型数据,比如省份【北京,上海,广州】,有些模型需要使用数字型进行计算,很自然的我们想将其转化为【0,1,2】的数字来表示,但是,这样会造成一个问题,数字是有大小的,而且是有顺序的,但是我们的数据没有大小的意义,数字映射并不符合原来特征的意义。为了解决这个问题,引入了独热编码也就是One-hot,也就是说,北上广,三种可能性,对应的三个互斥的编码,001,...原创 2018-12-21 16:30:32 · 1714 阅读 · 1 评论 -
pandas中map,apply,applymap的区别
基于Series数据结构的操作pandas.Series.applySeries.map对元素进行按元素操作For element-wise operationsSeries.agg官网注明只能使用聚合类型的操作,如sum,count,mean,std,prod,first,last,可以使用多个only perform aggregating type operations...原创 2018-12-27 16:17:39 · 868 阅读 · 0 评论