- 博客(6)
- 收藏
- 关注
原创 常见算法介绍
常用评估指标:精确率:预测结果与实际结果的比例;召回率“预测结果中某类结果的正确覆盖率;F1-Score:统计量,综合评估分类模型,取0-1之间;按原理分类:基于统计的:如贝叶斯分类;基于规则的:如决策树算法;基于神经网络的:神经网络算法;基于距离的:KNN(K近邻算法);
2023-06-08 14:05:32
55
1
原创 机器学习入门---KNN
KNN简介: 作为一种没有显式训练和学习过程的分类和回归算法,k 近邻在众多有监督机器学习算法中算是一种比较独特的方法。说它独特,是因为 k 近邻不像其他模型有损失函数、有优化算法、有训练过程。对于给定的实例数据和实例数据对应所属类别,当要对新的实例进行分类时,根据这个实例最近的 k 个实例所属的类别来决定其属于哪一类。所以相对于其它机器学习模型和算法,k 近邻总体上而言是一种非常简单的方法。 K...
2019-09-26 18:02:49
199
原创 深度学习二、处理数据过拟合
1、减少网络的大小 减少网络的层数或每层的单元数 2、添加权重正则化 L1正则化:权重系数的绝对值 L2正则化:权重系数的平方 from keras import regularizers model = models.Sequential() model.add(layers.Dense(16, kernel_regularizer=regularizers.l2(0.001), activa...
2019-09-26 17:34:09
548
2
原创 深度学习一、手写数字集识别
1、从Keras导入自带的数据集并切分为训练集和测试集 from keras.datasets import mnist (train_images,train_labels),(test_images,test_labels) = mnist.load_data() train_images.shape 运行结果(60000, 28, 28) 2、网络架构 from keras import m...
2019-09-26 17:29:57
504
原创 中文分词技术
中文分词技术 规则分词 规则分词主要有:正向最大匹配法、逆向最大匹配法、双向最大匹配法三种方法。 正向最大匹配法(Maximum Match Method MM法): 基本思想:假定分词词典中的最长词有i个汉字,则用被处理文档的当前字符串中的前i个字作为匹配字段,查找字典。若字典中存在这样的一个i个字词, 则匹配成功,匹配字段被作为一个词切分出来。 如果字典中找不到这样的一个i字词,则匹配失败,...
2019-09-17 15:09:03
129
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人