python
文章平均质量分 75
chen_sir_0
这个作者很懒,什么都没留下…
展开
-
中文分词技术
中文分词技术规则分词规则分词主要有:正向最大匹配法、逆向最大匹配法、双向最大匹配法三种方法。正向最大匹配法(Maximum Match Method MM法):基本思想:假定分词词典中的最长词有i个汉字,则用被处理文档的当前字符串中的前i个字作为匹配字段,查找字典。若字典中存在这样的一个i个字词,则匹配成功,匹配字段被作为一个词切分出来。如果字典中找不到这样的一个i字词,则匹配失败,...原创 2019-09-17 15:09:03 · 159 阅读 · 0 评论 -
深度学习一、手写数字集识别
1、从Keras导入自带的数据集并切分为训练集和测试集from keras.datasets import mnist(train_images,train_labels),(test_images,test_labels) = mnist.load_data()train_images.shape运行结果(60000, 28, 28)2、网络架构from keras import m...原创 2019-09-26 17:29:57 · 530 阅读 · 0 评论 -
深度学习二、处理数据过拟合
1、减少网络的大小减少网络的层数或每层的单元数2、添加权重正则化L1正则化:权重系数的绝对值L2正则化:权重系数的平方from keras import regularizersmodel = models.Sequential()model.add(layers.Dense(16, kernel_regularizer=regularizers.l2(0.001), activa...原创 2019-09-26 17:34:09 · 616 阅读 · 2 评论 -
机器学习入门---KNN
KNN简介:作为一种没有显式训练和学习过程的分类和回归算法,k 近邻在众多有监督机器学习算法中算是一种比较独特的方法。说它独特,是因为 k 近邻不像其他模型有损失函数、有优化算法、有训练过程。对于给定的实例数据和实例数据对应所属类别,当要对新的实例进行分类时,根据这个实例最近的 k 个实例所属的类别来决定其属于哪一类。所以相对于其它机器学习模型和算法,k 近邻总体上而言是一种非常简单的方法。K...原创 2019-09-26 18:02:49 · 205 阅读 · 0 评论