自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 软件设计模式笔记-面向对象设计原则

软件设计模式笔记-面向对象设计原则概述可维护性:指软件能够被理解、改正、适应及扩展的难易程度可复用性:指软件能够被重复使用的难易程度面向对象设计的目标之一在于支持可维护性复用,一方面需要实现设计方案或者源代码的复用,另一方面要确保系统能够易于扩展和修改,具有良好的可维护性。单一职责原则单一职责原则用于控制类的粒度大小。定义一个对象应该只包含单一的职责,并且该职责被完整地封装在一个类中。分析一个类(大到模块,小到方法)承担的职责越多,它被复用的可能性就越小;当一个职责变化时,可能会

2021-10-20 22:37:44 141

原创 机器学习笔记-TF-IDF统计方法

机器学习笔记-TF-IDF统计方法TF-IDF统计方法简介TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。其主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。TFIDF实际上是:TF∗IDFTF * IDFTF∗IDFTF为词频(Term Frequency),

2021-10-19 23:16:57 953

原创 机器学习笔记-数据预处理(标准化、归一化)(未完)

机器学习笔记-数据预处理(标准化、归一化)数据预处理(使用Scikit-Learn)sklearn.preprocessing 包sklearn.preprocessing 包提供了几个常用的效用函数和变换类,可以将原始特征向量转化为更适合其后的估计函数所需的形式。也就是对数据进行标准化处理。比如说,假如集合中存在异常值,使用robust scalers或者transformers就更合适一些。数据标准化Z-score(0-1标准化:移除平均值,将方差化为1)经过这种方法处理的数据符合标准正态分

2021-10-19 23:14:02 594

原创 机器学习笔记-基本python数据结构使用

机器学习笔记-基本python数据结构使用Python for Machine Learning阅读GitHub上的机器学习开源资料《A Complete Machine Learning Package》所做的笔记。数据结构(Lists, Dictionaries, Tuples, Sets)List使用方式:标识符 = [元素1, 元素2, 元素3, …]相关函数:list.sort() 排序list.reverse() 倒置list.append(element) 添加元素lis

2021-10-19 23:08:27 185

原创 机器学习笔记-分类的性能评测

分类的性能评测评价指标混淆矩阵(Confusion Matrix)Actual/Predict ClassC1~C1C1True Positive(TP)False Negative(FN)~C1False Positive(FP)True Negative(TN)感兴趣的为正类(Positive),反之为负类(Negative)。准确度Accuracy=(TP+TN)/ALLAccuracy=(TP+TN)/ALLAccuracy=(TP+TN)/A

2021-10-19 23:02:11 172

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除