数据处理
文章平均质量分 86
九城风雪
这个作者很懒,什么都没留下…
展开
-
Python进行线性规划求解
使用python处理多目标线性规划问题原创 2022-06-11 21:31:55 · 821 阅读 · 1 评论 -
pandas ix & iloc &loc 的联系和区别
参考了几个博客,做了以下整理,如有雷同,是我抄别人的。。参考链接:https://blog.csdn.net/xw_classmate/article/details/51333646https://blog.csdn.net/hecongqing/article/details/61927615loc——通过行标签索引行数据 iloc——通过行号索引行数据 ix——通过行标签或者...原创 2018-09-06 09:43:57 · 249 阅读 · 0 评论 -
pandas 重新索引
重新索引 pandas对象的一个重要方法是 reindex ,其作用是创建一个适应新索引的新对象。#reindex函数的参数reindex(index,method,fill_value,limit,level,copy)#index:用作索引的新序列#method:插值(填充)方式#fill_value:在重新索引的过程中,需要引入缺失值时使用的代替值#limit:前...转载 2018-09-06 08:58:00 · 5888 阅读 · 0 评论 -
pandas中关于set_index和reset_index的用法
1.set_indexDataFrame可以通过set_index方法,可以设置单索引和复合索引。 DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False) append添加新索引,drop为False,inplace为True时,索引将会还原为列 ...原创 2018-09-05 14:42:19 · 443 阅读 · 0 评论 -
numpy.random用法
最近发现numpy的random用法有很多,不注意很容易混淆,今天参考几个博客内容整理了一下。numpy.random.randintlow、high、size三个参数。默认high是None,如果只有low,那范围就是[0,low)。如果有high,范围就是[low,high)。>>> np.random.randint(2, size=10)array([1, ...原创 2018-08-23 11:25:33 · 113125 阅读 · 5 评论 -
PANDAS 数据合并与重塑(concat篇)
转载:https://blog.csdn.net/stevenkwong/article/details/52528616pandas作者Wes McKinney 在【PYTHON FOR DATA ANALYSIS】中对pandas的方方面面都有了一个权威简明的入门级的介绍,但在实际使用过程中,我发现书中的内容还只是冰山一角。谈到pandas数据的行更新、表合并等操作,一般用到的方法有con...转载 2018-08-14 16:19:10 · 252 阅读 · 0 评论 -
如何直观理解AUC评价指标?
导语最近一直在思考如何直观理解AUC,查了维基百科的以及网上的讲解描述,感觉仍然很难把这个概念表述得通俗易懂,直到昨天周会后拿笔在纸上画了画,感觉似乎找到了一种比较有意思的理解方法,下面就请各位看官容我慢慢道来。首先简单介绍一下什么是AUC。根据维基百科的描述,AUC(Area under the Curve of ROC)是ROC曲线下方的面积,是判断二分类预测模型优劣的标准。ROC(r...转载 2018-08-05 16:48:38 · 736 阅读 · 0 评论 -
机器学习中的数据预处理(sklearn preprocessing)
本文总结的是我们大家在python中常见的数据预处理方法,以下通过sklearn的preprocessing模块来介绍;1. 标准化(Standardization or Mean Removal and Variance Scaling)变换后各维特征有0均值,单位方差。也叫z-score规范化(零均值规范化)。计算方式是将特征值减去均值,除以标准差。? 1 ...翻译 2018-07-27 11:33:00 · 1564 阅读 · 0 评论 -
Python绘图总结(seaborn篇)之概况
导入seaborn会改变matlotlib默认的颜色和绘图样式,提高可读性和美感。即使不适用seaborn的API,也可以利用seaborn来提高可视化的效果。# 使用该魔法,不用写plt.show(),以及可以边写边运行# %matplotlib notebookimport matplotlib.pyplot as pltimport numpy as npimport pandas as p...转载 2018-05-09 19:33:07 · 1534 阅读 · 0 评论 -
用Python进行数据挖掘(数据预处理)
用Python进行数据挖掘(数据预处理)本博客进行数据预处理的方法总结自kaggle的几道题目: 1.HousePrices 2.Titanic 以及比较不错的几个kernels: 1.https://www.kaggle.com/pmarcelino/house-prices-advanced-regression-techniques/comprehensive-data-exploratio...原创 2018-05-09 18:53:37 · 1139 阅读 · 0 评论 -
Python数据处理的一些总结-1
[python] view plain copyimport pandas as pd import numpy as np #载入数据 train=pd.read_csv('Train.csv') test=pd.read_csv('Test.csv') #显示一下数据的大小 #可以通过train.shape, test.shape查看 train.dtypes#查看每...转载 2018-05-09 18:31:23 · 1471 阅读 · 0 评论