Python
文章平均质量分 52
介绍Python编程知识
麻瓜1号
这个作者很懒,什么都没留下…
展开
-
Python系列 | missingno模块(缺失值可视化)
import missingno原创 2021-03-27 20:43:35 · 16163 阅读 · 2 评论 -
Python系列 | shutil模块常用命令
shutil.copyshutil.rmtree原创 2021-03-11 21:38:23 · 537 阅读 · 1 评论 -
Python系列 | tqdm模块(显示进度条)
import tqdm原创 2021-03-10 14:37:20 · 427 阅读 · 0 评论 -
Python系列 | glob模块
import glob原创 2021-03-10 13:53:51 · 264 阅读 · 0 评论 -
Python系列 | 常见的特殊属性与特殊方法
在 Python 对象中,需要重写的双下划线开头和结尾的属性称为特殊属性,另外以双下划线开头和结尾的方法称为特殊方法。常见的特殊属性:__name__常见的特殊方法:__init__ 、 __getitem__ 、 __len__1、__name__即对象的名称。2、__init____init__ 是用于创建实例后进行必要的初始化,若是在书写类时,继承了父类,Python并不会自动调用父类的 __init__ 方法,若需要继承父类的 __init__ 方法,需要在 __init__ 下增加一行原创 2021-03-05 13:58:12 · 410 阅读 · 0 评论 -
Python系列 | 自定义数据集(划分训练集与验证集)
自定义划分数据集为两部分:训练集和测试集。原创 2021-03-04 15:16:32 · 2769 阅读 · 3 评论 -
Python系列 | os模块常用命令
import os原创 2021-03-01 16:44:46 · 995 阅读 · 4 评论 -
Python系列 | 利用sklearn快速识别和处理异常值(EllipticEnvelope与KNNImputer)
在进行数据分析或挖掘时,不免会遇到dirty data,而清洗数据的过程,异常值是不可忽视的一部分,产生异常值的原因多种多样,本文对此不进行展开。对于这些异常值,可以利用sklearn中的EllipticEnvelope快速进行识别和处理。话不多说,上代码:# 以回归数据集为例from sklearn.datasets import make_regressiondata,_ = make_regression(n_samples=10, # 这里仅需要x变量进行展示原创 2021-02-22 19:02:50 · 4265 阅读 · 0 评论 -
Python系列 | 利用sklearn进行one-hot编码(LabelBinarizer与MultiLabelBinarizer)
众所周知,当我们遇到nominal型特征时(统计学上称为定性变量),也就是用文字或字符串进行表示的变量,有时候需要将此类定性变量转换为定量变量(数值),从而进行下一步的数据分析或挖掘。在sklearn中,有一个非常方便的class——LabelBinarizer。利用LabelBinarizer可以快速进行one-hot编码,实现定性变量定量化。话不多说,看代码:import numpy as np# 先创建一个特征nomial = np.array([["A"],原创 2021-02-21 20:56:20 · 3729 阅读 · 2 评论 -
Python系列 | Python3.6及以上的print新用法
在python3.6及以上,关于格式化输出有了一个新用法,举个例子。在3.6以前的版本中,我们习惯于用format格式化输出结果:import numpy as npa = np.random.rand(3, 2)print("This is a random array a: \n {}".format(a))其输出结果为:This is a random array a: [[0.01066734 0.09696758] [0.17472408 0.38904432] [0.434原创 2021-02-04 10:44:17 · 486 阅读 · 0 评论 -
Python系列 | 初识篇——面向对象与面向过程(Object Oriented v.s Procedure Oriented)
面向对象:面向过程:原创 2020-11-07 10:16:20 · 146 阅读 · 0 评论