- 博客(5)
- 收藏
- 关注
原创 软件设计模式笔记-面向对象设计原则
软件设计模式笔记-面向对象设计原则概述可维护性:指软件能够被理解、改正、适应及扩展的难易程度可复用性:指软件能够被重复使用的难易程度面向对象设计的目标之一在于支持可维护性复用,一方面需要实现设计方案或者源代码的复用,另一方面要确保系统能够易于扩展和修改,具有良好的可维护性。单一职责原则单一职责原则用于控制类的粒度大小。定义一个对象应该只包含单一的职责,并且该职责被完整地封装在一个类中。分析一个类(大到模块,小到方法)承担的职责越多,它被复用的可能性就越小;当一个职责变化时,可能会
2021-10-20 22:37:44 141
原创 机器学习笔记-TF-IDF统计方法
机器学习笔记-TF-IDF统计方法TF-IDF统计方法简介TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。其主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。TFIDF实际上是:TF∗IDFTF * IDFTF∗IDFTF为词频(Term Frequency),
2021-10-19 23:16:57 953
原创 机器学习笔记-数据预处理(标准化、归一化)(未完)
机器学习笔记-数据预处理(标准化、归一化)数据预处理(使用Scikit-Learn)sklearn.preprocessing 包sklearn.preprocessing 包提供了几个常用的效用函数和变换类,可以将原始特征向量转化为更适合其后的估计函数所需的形式。也就是对数据进行标准化处理。比如说,假如集合中存在异常值,使用robust scalers或者transformers就更合适一些。数据标准化Z-score(0-1标准化:移除平均值,将方差化为1)经过这种方法处理的数据符合标准正态分
2021-10-19 23:14:02 594
原创 机器学习笔记-基本python数据结构使用
机器学习笔记-基本python数据结构使用Python for Machine Learning阅读GitHub上的机器学习开源资料《A Complete Machine Learning Package》所做的笔记。数据结构(Lists, Dictionaries, Tuples, Sets)List使用方式:标识符 = [元素1, 元素2, 元素3, …]相关函数:list.sort() 排序list.reverse() 倒置list.append(element) 添加元素lis
2021-10-19 23:08:27 185
原创 机器学习笔记-分类的性能评测
分类的性能评测评价指标混淆矩阵(Confusion Matrix)Actual/Predict ClassC1~C1C1True Positive(TP)False Negative(FN)~C1False Positive(FP)True Negative(TN)感兴趣的为正类(Positive),反之为负类(Negative)。准确度Accuracy=(TP+TN)/ALLAccuracy=(TP+TN)/ALLAccuracy=(TP+TN)/A
2021-10-19 23:02:11 172
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人