自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 python[-1], [:-1], [::-1]速记

老是忘记的小小知识点,记录分享一下:-)1.[-1]是取倒数第一个2.[:-1]是第1个到倒数第2个(同理,[1:-1]是从第2个到倒数第2个(指标从0开始,[0]是第一个))3.[::-1]是从倒数第一个开始,倒序列出来4.[1::-1]是从第2个(指标为1)开始倒序列出如下图所示:...

2020-11-04 04:16:34 279

原创 如何判断dataframe全都不为空值

场景:当数据集全都不为空值时,由于数据集较大,编程界面不能显示所有空值判断结果,我们希望程序可以直接帮我们判断出来。可以用如下语句:输出结果如下:

2020-10-22 04:19:24 1442

原创 表格对齐函数pandas.datafram.align的参数“join”说明

场景:做数据分析的时候,我们经常需要对数据预处理后的训练集和测试集两个表格进行对齐。这时候我们可以用上pandas DataFram.align这个函数 。函数作用是返回列/行对齐后的两个表。但其文档https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.align.html没有对参数"join"作进一步说明。以下用例子来说明该参数的作用:先建两个表:(1) 设置join = "inner"...

2020-10-14 10:35:34 614 1

原创 sklearn.LabelEncoder解决未见过值问题(eg.“y contains previously unseen labels: nan“)

主要思路:把原数据集(比如train data set)里面没有但是在新数据集(比如test data set)遇到的新值放到一个类里面,再将类回传给LabelEncoder.

2020-10-09 22:17:55 5028 2

原创 label encoding和one hot encoding简单对比

对类别变量进行处理的方法 概念 缺点 备注 label encoding 随机赋予类别变量数值 赋值难以解释,不适用与类别变量有高低之分的场景(如本科生、硕士研究生、博士生)以及对数值大小敏感的模型(如逻辑回归、SVM等) 当变量是无序变量的时候,label encoding比one-hot encoding 好 one-hot encoding 将类别变量展开成特征列名,用0/1表示样本是否具备该特征 当类别特别多时,特征空间会变得很大 ...

2020-10-09 09:52:50 781

转载 Python中列表,字典,元组,集合的区别

一、二、(一)列表list,用中括号“[ ]”表示1.任意对象的有序集合列表是一组任意类型的值,按照一定顺序组合而成的2.通过偏移读取组成列表的值叫做元素(Elements)。每一个元素被标识一个索引,第一个索引是0,序列的功能都能实现3.可变长度,异构以及任意嵌套列表中的元素可以是任意类型,甚至是列表类型,也就是说列表可以嵌套4.可变的序列支持索引、切片、合并、删除等等操作...

2019-03-16 11:14:21 316

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除