python
遗忘了伤痛的少年
这个作者很懒,什么都没留下…
展开
-
动手学数据分析 Task5
动手学数据分析 Task5一、逻辑回归二、随机森林三、模型评估3.1 k折交叉验证3.2 混淆矩阵3.3 ROC曲线一、逻辑回归LogisticRegression(penalty='l2', dual=False, tol=0.0001, C=1.0, fit_intercept=True, intercept_scaling=1, class_weight=None, random_state=None, solver='liblinear', max_iter=100, multi_class='原创 2020-08-27 23:42:02 · 549 阅读 · 0 评论 -
动手学数据分析 Task4
动手学数据分析 Task4一、可视化展示泰坦尼克号数据集中男女中生存人与死亡人数的比例图二、可视化展示泰坦尼克号数据集中不同票价的人生存和死亡人数分布情况三、可视化展示泰坦尼克号数据集中不同年龄的人生存与死亡人数分布情况一、可视化展示泰坦尼克号数据集中男女中生存人与死亡人数的比例图并列柱状图或叠加柱状图都可以很好地展示这道题的结果,方法也类似,只需在参数中设置stack=True或False。##并列柱状图train.groupby(['Sex','Survived']) ['Survived'].原创 2020-08-25 22:56:56 · 399 阅读 · 0 评论 -
动手学数据分析 Task3
动手学数据分析 Task3一、concat、merge、join二、groupby一、concat、merge、joinconcat方法可以在两个维度上拼接,默认纵向凭借(axis=0),拼接方式默认外连接pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, keys=None, levels=None, names=None, verify_int原创 2020-08-23 16:04:00 · 252 阅读 · 1 评论 -
动手学数据分析 Task 2
动手学数据分析 Task 2一、处理缺失值二、分箱操作三、LabelEncoder 和 OneHotEncoder一、处理缺失值常用的函数有dropna()和fillna()。DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)属性说明:默认参数axis=0,根据索引(index)删除指定的行; axis=1,根据列名(columns)删除指定的列默认axis=0,how=‘any’,删除带有空原创 2020-08-21 21:27:29 · 261 阅读 · 0 评论 -
动手学数据分析 Task 1
动手学数据分析 Task 1一、数据加载二、Pandas基础三、探索性数据分析一、数据加载项目源数据请见 kaggle。1.对于csv中的数据,pandas库提供两种方法来读取,分别为:read_csv()和read_table()。二者的区别为:read_table()以制表符 \t 作为数据的标志,也就是以行为单位进行存储;而read_csv()则是按csv file 中的每一格为单位进行存储。读取数据时最好使用绝对地址。如果要用相对地址却又不知道当前工作目录,则可以用下面的方法获得:impo原创 2020-08-19 21:19:20 · 263 阅读 · 1 评论