pandas API
Wang_PChao
这个作者很懒,什么都没留下…
展开
-
Pandas API:value_counts() 特征取值计数
数据中存在分类数据,我们需要了解不同的类别对应的种类数量原创 2020-03-16 00:01:06 · 1692 阅读 · 0 评论 -
Pandas API:cut() 将数值转为离散区间
结合直方图的显示“盒子”概念,英文:bins文档:https://pandas.pydata.org/docs/reference/api/pandas.cut.html?highlight=cut#pandas.cut原创 2020-03-09 23:57:53 · 528 阅读 · 0 评论 -
Pandas API:fillna函数 填充缺失值
也可以使用scikit-learn填充缺失值:使用scikit-learn中的SimpleImputer(原sklearn.preprocessing.Imputer)处理缺失值函数原型以及参数说明用法举例>>> df = pd.DataFrame([[np.nan, 2, np.nan, 0],... [3, 4, np...原创 2020-03-03 21:53:06 · 981 阅读 · 0 评论 -
Pandas API:drop函数 删除指定行或者列
函数介绍用法举例>>> df = pd.DataFrame(np.arange(12).reshape(3, 4),... columns=['A', 'B', 'C', 'D'])>>>df A B C D0 0 1 2 31 4 5 6 72 8 9 1...原创 2020-03-02 18:56:41 · 1653 阅读 · 1 评论 -
Pandas API:dropna函数 删除无效值
函数介绍函数举例>>>df = pd.DataFrame({"name": ['Alfred', 'Batman', 'Catwoman'],... "toy": [np.nan, 'Batmobile', 'Bullwhip'],... "born": [pd.NaT, pd.Timest...原创 2020-03-02 18:25:57 · 985 阅读 · 0 评论 -
机器学习-数据处理:使用corr()和scatter_matrix()函数寻找属性之间的相关性
在机器学习的数据分析阶段,找到那些和待预测量有较强关联的特征对解决问题有非常大的帮助,为解决这个问题,我们可以分别使用pandas提供的两个函数corr()和scatter_matrix()使用corr()函数计算每对属性之间的标准相关系数函数原型DataFrame.corr(self, method='pearson', min_periods=1)函数功能计算数值列的两两相...原创 2020-03-02 12:06:00 · 4528 阅读 · 0 评论