pandas
CristinaM
这个作者很懒,什么都没留下…
展开
-
【Pandas操作】之列名
1. 参考:Pandas中修改DataFrame列名创建一个DataFrameimport pandas as pda = pd.DataFrame({'A':[1,2,3], 'B':[4,5,6], 'C':[7,8,9]})print(a) A B C0 1 4 71 2 5 82 3 6 9方法1,直接赋值缺点:必须把所有的列名都写上,否则...原创 2019-12-10 09:11:13 · 1129 阅读 · 0 评论 -
芝加哥犯罪率数据集(数据分析与特征处理)
参照:SF-Crime Analysis & PredictionCrime Scene Exploration and Model Fit主要是因为这个数据集包含了时间序列和坐标点。练习一下特征处理。数据分析导入库#%%%matplotlib inlineimport numpy as np import pandas as pdimport mathimport s...原创 2019-12-08 16:42:35 · 6284 阅读 · 1 评论 -
.shape[0]
import numpy as npimport pandas as pdc= np.array(([[1,1],[1,2],[1,3],[1,4]]))c = pd.DataFrame(c)print(c) 0 10 1 11 1 22 1 33 1 4print(c.shape[0])4原创 2019-12-08 14:27:05 · 1540 阅读 · 1 评论 -
LabelEncoer,类别特征转换为数值特征,transform的使用
demo参照E-Commerce Data那篇对country类别的处理。换个简单的数据集Demo:import pandas as pdimport numpy as npdf = pd.DataFrame({"Person": ["John", "Myla", "Lewis", "John", "Myla"], ...原创 2019-12-07 10:27:50 · 763 阅读 · 0 评论 -
pandas.Series.str.contains(筛选)
https://blog.csdn.net/weixin_43615654/article/details/103419171这篇里用到了一个Str的contains函数,查了一下用法。pandas.Series.str.containsReturns: Series or Index of boolean valuesA Series or Index of boolean value...原创 2019-12-07 09:42:47 · 911 阅读 · 0 评论 -
Pandas的count()与value_counts()区别
pandas.DataFrame.count函数方法的使用count计算每列或每行的非NA单元格。值None,NaN,NaT和可选的numpy.inf(取决于pandas.options.mode.use_inf_as_na)被视为NA。demo:import pandas as pdimport numpy as npdf = pd.DataFrame({"Person":...原创 2019-12-06 15:44:47 · 6174 阅读 · 0 评论 -
Python | Pandas Series.reset_index()
参考:https://www.geeksforgeeks.org/python-pandas-series-reset_index/语法: Series.reset_index(level=None, drop=False, name=None, inplace=False)参数level : For a Series with a MultiIndexdrop : Just res...翻译 2019-11-26 20:49:20 · 760 阅读 · 0 评论