![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 87
AQH~
学习中寻找快乐。。。
展开
-
BIO序列提取实体(NER命名实体识别)
1、NER命名实体识别,网络预测的结果BIO,如何转录,提取出实体?思路1:遇到B则前面存在的实体,进行一次存储。多个i粘连一块儿也可能被认为是一个实体。错误的情况是B识别成i了。对于类别判断失误,粘连的实体取众数。#标签转录BIO格式string="我是李明,我爱中国,我来自呼和浩特"tags=["o","o","i-per","i-per","o","o","o","b-loc","i-loc","o","o","o","o","b-per","i-loc","i-loc","i-loc"原创 2020-08-03 15:28:39 · 6612 阅读 · 8 评论 -
linux常见命令
1、激活命令source ~/.bashrc2、添加环境变量如:python有依赖包添加环境变量(修改环境变量/etc/profile)vi /etc/profile 在最后一行添加(/root/sw/是路径)export PYTHONPATH=$PYTHONPATH:/root/sw/i 进入编辑esc+wq(按完esc,按个冒号,再输入wq,保存退出)exc+...原创 2019-10-23 09:49:28 · 312 阅读 · 0 评论 -
傅里叶分析之掐死教程(完整版)
傅里叶分析之掐死教程(完整版)更新于2014.06.06(Heinrich)作 者:韩 昊知 乎:Heinrich微 博:@花生油工人知乎专栏:与时间无关的故事谨以此文献给大连海事大学的吴楠老师,柳晓鸣老师,王新年老师以及张晶泊老师。转载的同学请保留上面这句话,谢谢。如果还能保留文章来源就更感激不尽了。——更新于2014.6.6,想直接看更新的同学可以直接跳到第四章——...转载 2019-04-02 08:20:33 · 173 阅读 · 0 评论 -
图像分类(ResNet、ResNetxt、InceptionV4)
1、ResNet(残差网络)残差网络就是加一个直连,在两个卷积操作中加入一个直连,这样操作优点在于求导操的时候,阻止了梯度消失(怎么加?注意这里的直连不是拼接,卷积操作后要保证与原始输入通道一致,然后对应位置相加)。残差网络是基于vgg19,vgg19=2conv+2conv+4conv+4conv+4conv+3fcl,34层的残差网络=1conv+6conv+8conv+12...原创 2019-07-30 09:17:20 · 7324 阅读 · 0 评论 -
图像分类(AlexNet、Vgg、GoogLeNetV1-V3)
1、预备知识①卷积操作(卷积核其实是一个立方体,64*64*3通过100个3*3的卷积核得到64*64*100,再通过一个3*3的卷积得到64*64*1,这里padding=1,stride=1卷积后图像长宽不变)我想表达的是,卷积核的默认维度是输入图像的通道数。②池化操作(降维)2、AlexNet网络①5个卷积层+3个全连接层(5个卷积跟5个激活)②ReLu非线性激活...原创 2019-07-24 14:01:13 · 1257 阅读 · 0 评论 -
git新手使用教程
1、准备工作,git下载安装(傻瓜式安装即可)2、第一种方式同步项目(先克隆,修改后再上传)①github上创建一个仓库(github登录名是邮箱或者是用户名)1)、在页面上方用户菜单上选择 “+”->New repository 创建一个新的仓库2)、仓库取一个名字,点击创建仓库按钮(create repository),你将成功创建一个仓库②复制新建仓库的url(克隆...原创 2019-09-02 11:39:40 · 7424 阅读 · 0 评论 -
NLP(理论基础)
小白一枚,看了很多天的NLP,也没看出什么头绪。代码不代码的我感觉只要用心去看,即使看不懂,一点一点的去啃,也能看个大概。最重要的是思想。1、首先介绍一下NLP的基础知识①分词1)nltk安装(pip install nltk)nltk就是一个工具包,里面有很多语料,很多模型。可以用来分词。import nltksentence = “hello, world"token...原创 2019-09-04 14:24:05 · 1685 阅读 · 0 评论 -
常见的降维方法(PCA,SVD)
1、PCA降维(主成分分析)PCA降维就是去除线性相关,使得最后剩余的属性维度全都线性无关。其实:PCA降维不仅是去除先线性无关,还可以过滤掉小特征值对应的特征向量。因为特征值变化小,对应的特征向量变化也小,转换后两个维度相似性就比较大。相似度大就没有意义。 均值(平均值) 样本方差(总体方差是n,样本方差是n-1) 协...原创 2019-09-10 11:30:47 · 8407 阅读 · 1 评论 -
朴素贝叶斯法(应用)
1、分类和回归①回归问题的应用场景(预测的结果是连续的,例如预测明天的温度,23,24,25度)回归问题通常是用来预测一个值,如预测房价、未来的天气情况等等,例如一个产品的实际价格为500元,通过回归分析预测值为499元,我们认为这是一个比较好的回归分析。一个比较常见的回归算法是线性回归算法(LR)。另外,回归分析用在神经网络上,其最上层是不需要加上softmax函数的,而是直接对前一层累加...原创 2018-08-15 09:13:45 · 1003 阅读 · 0 评论 -
SVM(支持向量机)
1、何为SVM?① SVM,中文名支持向量机,分类最基本的想法是:在样本空间中找到一个划分超平面,将不同的类别划分开。然而这个划分超平面很多,我们应该去找哪一个呢?如下图所示:②给定训练样本集D={(x1,y1),(x2,y2),(x3,y3),......,(x1,y1)},Y∈{-1,1},每一个样本(xi,yi)可以看做这个样本的两个特征。SVM就是去找划分超平面,如何找呢?...原创 2019-07-24 14:16:09 · 587 阅读 · 0 评论 -
SoftMax在tensorflow下实现Mnist数据快速读入和随机填充训练
1、上一篇在介绍tensorflow常用函数中,利用tensorflow库函数,实现了Softmax(手写字体分类)。在另外一片中也介绍了用纯手写实现Maxsoft(3种类型点分类)2、在手写字体分类时,在数据读入(专门针对Mnist数据集)有很强大的函数,不仅能够读入数据,而且还能够传入数据时随机传入固定的数据量(减少训练时间)。3、自己手写的读入数据函数区别:①库函数可以实现每次随机固定量的训...原创 2018-05-31 14:09:29 · 331 阅读 · 0 评论 -
numpy和plt常见函数总结
1、linspace#coding:utf-8import numpy as np#[0,1]之间默认划为50个点a=np.linspace(0, 1)#[0,1]之间划分为10个点,b=np.linspace(0,1,10)print aprint bprint len(a) #50print len(b) #102、random(random.random原创 2018-01-23 09:20:11 · 3453 阅读 · 0 评论 -
吴恩达_两层神经网络实战(第一课~第三周)
本次实现具有一个隐藏层的神经网络1.导入需要使用的库转载 2018-01-31 10:24:09 · 1332 阅读 · 0 评论 -
吴恩达_Logistic实战(第一课~第二周)
1、实现一个完成Logistic函数。包括:初始化、计算代价函数和梯度、使用梯度下降算法进行优化等并把他们整合成为一个函数。本实验用于通过训练来判断一副图像是否为猫。2、在这个过程中,我们将会用到如下库:#coding:utf-8import numpy as np #科学计算包,处理大型矩阵import h5py转载 2018-01-18 19:28:17 · 1305 阅读 · 3 评论 -
Linux下安装jdk(新手)
1、Windows本地下载相应jdk压缩包我下载的版本是jdk-8u161-linux-x64.tar.gz,.tar.gz是一种压缩文件,在Linux下常见。2、安装Xshell (下载Xmanger即可)Xftp:Windows和linux文件传输Xshell:Windows通过SSH访问linux(其中包含了Xftp)3、打开Xshell连接成功之后,在窗口中找到原创 2018-03-20 11:00:32 · 156 阅读 · 0 评论 -
SoftMax实现多分类(不含隐藏层)
哎,看了一周,终于算是看了个大概,知其然而不知其所以然...,与LR回归不一样的是这里的分类结果是多类,这里举一个网上很常见的例子,三种类型的点各100个,对其进行分类。1、数据生成①数据生成没什么难点,就是中间有点小细节需要处理②scatter的参数都是不规则写法③只有是一维的时候reshape和转置才相同,否则不一致(没有注意到,坑了很久)def load_data(): np.ran...原创 2018-05-16 10:10:13 · 3204 阅读 · 0 评论 -
TensorFlow常见函数
第一次开始接触tensorflow,据说这个工具很强大,分装了很多算法,而且只需要设计正向传播函数,逆向传播框架自己会求,在学习神经网络上很方便和快捷。下面介绍我的第一个tensorflow程序。以及tensorflow常见的函数:...原创 2018-05-24 08:32:00 · 311 阅读 · 0 评论 -
Minst+CNN+SoftMAX
1、前几天总结了SoftMax实现手写字体识别,但是准确率不高(没有隐藏层),增加卷积操作,可以提高准确率。2、CNN就是卷积操作,池化操作,全连接层①卷积操作卷积操作,就是通过卷积核进行一个特征提取的过程。tf.nn.conv2d(input, filter, strides, padding)input:输入数据(个数,高,宽,通道) filter:卷积核(高,宽,通道,卷积核个数)strid...原创 2018-06-06 08:50:52 · 862 阅读 · 0 评论 -
决策树
决策树是一种基于分类与回归方法,决策数学习通过通常包括3个步骤:特征选择、决策树生产和决策树的修剪。常用的算法有ID3、C4.5、CART。决策树是一种描述对实例进行分类的树形结构,决策树由结点和有向边组成,结点有两种类型:内部结点、叶结点。内部结点表示特征或者属性,叶子结点表示一个类。①特征的选择为了进行特征选择,给出熵和条件熵的定义,从而求取信息增益和信息增益比。熵表示随机变量不确...原创 2018-10-10 08:26:18 · 306 阅读 · 0 评论