吴恩达机器学习课程笔记
文章平均质量分 52
黄佳俊、
to be or not to be!
热爱生活!
执着学习!
展开
-
plt.xticks()的理解
在matplotlib中ticks表示的是刻度,而刻度有两层意思,一个是刻标(locs),一个是刻度标签(tick labels)。在作图时,x轴y轴都是连续的,所以刻标可以随意指定,就是在连续变量上找寻位置,而刻度标签则可以对应替换xticks(rotation:旋转度数):更改绘制x轴标签方向(与水平方向的逆时针夹角度数)#plt.xticks()返回了两个对象,一个是刻标(locs),另一个是刻度标签locs, labels = plt.xticks()# 显示x轴的刻标plt.xt原创 2021-12-02 10:49:51 · 37837 阅读 · 2 评论 -
python分析中的mode()
mode():此方法用于获得该列“众数”即本特征下取值最多的那个特征值(因而可能不止一个结果)如果你想用mode()函数的计算结果填充DataFrame的缺失值,请使用这个方法:df.fillna(df.mode().iloc[0])。原因在于,每列的mode()结果不止一个,所以我们得到的是一个DataFrame。我们用其第一行进行缺失值填充。DataFrame.mode(axis=0, numeric_only=False)此外,根据mode()的参数,我们可以传入axis =.原创 2021-12-02 10:44:24 · 12121 阅读 · 0 评论 -
fillna()函数的含义
含义:填充空值#用常数填充print (df1.fillna(100))print ("-----------------------")print (df1)运行结果:参考资料:fillna()函数详解_大胡子的博客-CSDN博客_fillna原创 2021-12-02 10:42:17 · 1409 阅读 · 0 评论 -
sns.distplot()用法
sns.distplot()集合了matplotlib的hist()于sns.kdeplot()功能,增了rugplot分布观测显示与理由scipy库fit拟合参数分布的新颖用途#参数如下sns.distplot(a, bins=None, hist=True, kde=True, rug=False, fit=None, hist_kws=None, kde_kws=None, rug_kws=None, fit_kws=None, color=None, vertical=False, norm原创 2021-12-02 10:39:15 · 13454 阅读 · 0 评论 -
数据预处理之将类别数据数字化的方法 —— LabelEncoder
LabelEncoder是什么在数据处理过程中,我们有时需要对不连续的数字或者文本进行数字化处理。 在使用 Python 进行数据处理时,用 encoder 来转化 dummy variable(虚拟数据)非常简便,encoder 可以将数据集中的文本转化成0或1的数值。 LabelEncoder 是 scikit-learn 包中的两个功能,可以实现上述的转化过程。数据集中的类别数据在使用回归模型和机器学习模型时,所有的考察数据都是数值更容易得到好的结果。因为回归和机器学习都是基于数学函数方原创 2021-12-02 10:34:40 · 1571 阅读 · 0 评论 -
Sklearn之数据预处理——StandardScaler
StandardScaler原理作用:去均值和方差归一化。且是针对每一个特征维度来做的,而不是针对样本。标准差标准化(standardScale)使得经过处理的数据符合标准正态分布,即均值为0,标准差为1,其转化函数为: 其中μ为所有样本数据的均值,σ为所有样本数据的标准差。使用sklearn提供的StandardScaler方法from sklearn.preprocessing import StandardScaler # 标准化工具impor...原创 2021-12-02 10:31:32 · 8482 阅读 · 0 评论 -
精确度/召回率/F1值/Micro-F1和Macro-F1的理解
如下图所示,假设有若干张图片,其中12张是狗的图片其余是猫的图片.现在利用程序去识别狗的图片,结果在识别出的8张图片中有5张是狗的图片,3张是猫的图片(属于误报).图中,实心小圆代表狗的图片,虚心小圆代表猫的图片,圆形区域代表识别结果.则该程序的精度precision=5/8,召回率recall=5/12。当一个搜索引擎返回30个页面时,只有20页是相关的,而没有返回40个额外的相关页面,其精确度为20/30 = 2/3,而其召回率为20/60 = 1/3。在这种情况下,精确度是“搜索结果有多原创 2021-12-02 10:21:34 · 6152 阅读 · 0 评论 -
机器学习(篇一:机器学习的定义和分类)
什么是机器学习?计算机程序从经验E学习,解决某一任务T,进行某一性能度量P。通过P测定在T上的表现因经验E而提高。机器学习算法的分类监督学习(我们会教计算机做某件事情)给算法一个数据集,其中包含了正确答案和错误答案,算法会分析出规律来预测和得出正确答案。监督学习包括了回归问题和分类问题等。回归问题:已知一系列正确对应关系,算法分析这些正确对应关系,找到正确的规律,这样当输入一个数据,算法可根据规律,推测出该数据对应的正确答案。 分类问题:给了算法一系列混杂的正确答案和错误答案(原创 2021-04-22 20:51:44 · 490 阅读 · 0 评论