自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

suifeng2018的专栏

用文字记录成长

  • 博客(21)
  • 资源 (2)
  • 收藏
  • 关注

原创 常用kubectl管理kubernetes命令记录(不定时更新)

这里写自定义目录标题常用kubectl操作k8s命令记录(不定时更新)查询部署删除进入pod控制台部署管理运维管理常用kubectl操作k8s命令记录(不定时更新)查询# 查node信息kubectl get nodes# 查所有namespace的pod信息kubectl get pods --all-namespaces -o wide # 查看某个pod的配置,以yaml格式展示kubectl get pod podname -n namespace -o yaml# 导出某个pod

2022-01-25 17:53:22 848

原创 如何将本地开发的项目提交到码云?

1、本地安装git环境下载安装包安装即可2、初始化git项目,生成 .git 配置目录进入项目根目录,右键 git bash here打开控制台 ,输入git init即可完成3、将项目加入本地git仓库git add . (此处add后面有空格 和点号)git statustouch README.md (可不要git add README.m

2018-01-25 13:53:18 9486 1

原创 修改intellij IDEA 项目编码

点file菜单中的setting项进入,按如下操作即可:如上图所示。

2017-12-21 10:20:42 16975

原创 计算机领域中的IO是什么概念,有哪些使用场景,编程时涉及IO问题应该注意什么?

IO(Input/Output)指的是计算机与外部环境之间的数据交换过程,包括输入和输出。在计算机领域中,IO通常是指程序从外部设备(例如:鼠标、键盘、显示器、硬盘等)读取数据或向外部设备发送数据的过程。在计算机编程中,IO常见的使用场景包括文件操作、网络通信、图形界面交互等。尤其是在循环中频繁进行的IO操作,容易导致程序运行效率低下。对于大文件或大量数据的读写操作,最好采用缓冲技术,减少IO操作的次数。合理关闭打开的IO资源,以避免资源泄露和程序出错。使用适当的IO方式:同步IO和异步IO。

2023-10-18 14:56:02 345

原创 NLP实践系列:10、最强NLP模型:BERT

导论:2018年NPL领域,很不凡,二月出了 ELMo,六月出了 OpenAI Transformer,十月又出了BERT,模型一个比一个强大,性能也是越加优良,最为目前特别亮眼的Bert模型,被称为最强NPL模型,究竟有何特别之处呢?他是有何而来的?接下来我们来探讨一下。1. Transformer的原理。自从google推出word2vec,传统的基于统计学的语言处理模型与基于神经网络...

2019-03-23 00:30:21 1839

原创 NLP实践系列:9、Attention原理

1. Attention机制由来编码器-解码器 (Encode-Decode) 结构在许多领域较其他的传统模型方法都取得了更好的结果。这种结构的模型通常将输入序列编码成一个固定长度的向量表示,对于长度较短的输入序列而言,该模型能够学习出对应合理的向量表示。然而,这种模型存在的问题在于:当输入序列非常长时,模型难以学到合理的向量表示。使用传统编码器-解码器的RNN模型先用一些LSTM单元来对输入...

2019-03-19 21:58:34 383

原创 NPL实践系列:8、循环神经网络

1. RNN介绍1.1 RNN结构RNN(Recurrent Neural Network),即是循环神经网络,是一类用于处理序列数据的神经网络。从基础的神经网络中知道,神经网络包含输入层、隐层、输出层,通过激活函数控制输出,层与层之间通过权值连接。激活函数是事先确定好的,那么神经网络模型通过训练“学“到的东西就蕴含在“权值“中。基础的神经网络只在层与层之间建立了权连接,RNN最大的不同之...

2019-03-16 21:58:55 775

原创 NPL实践系列:7、卷积神经网络

1. 卷积运算1.1卷积运算定义卷积,是我们在各种工程领域,信号领域所看到的常用名词,学通信的同学应该很熟悉。那什么是卷积?通俗来说,即是这样的一个变换过程:输出 = 输入 * 系统虽然它看起来只是个复杂的数学公式,但是却有着重要的物理意义,因为自然界这样的系统无处不在,计算一个系统的输出最好的方法就是运用卷积。更一般的,我们还有很多其他领域的应用:统计学中,加权的滑动平均是一种卷积。...

2019-03-15 21:55:12 1522

原创 NPL实践系列:6、简单神经网络

1. 文本表示:从one-hot到word2vec1.1 词袋模型:离散、高维、稀疏1.2 分布式表示:连续、低维、稠密。word2vec词向量原理并实践,用来表示文本2. 走进FastText2.1 FastText的原理2.2 利用FastText模型进行文本分类...

2019-03-13 17:16:09 454

原创 NPL实践系列:5、神经网络基础

1. 神经网络基础概念1.1前馈神经网络、1.2网络层数、输入层、隐藏层、输出层、隐藏单元1.3激活函数。2. 感知机相关;利用tensorflow等工具定义简单的几层网络(激活函数sigmoid),递归使用链式法则来实现反向传播。3. 激活函数的种类以及各自的提出背景、优缺点。(和线性模型对比,线性模型的局限性,去线性化)4. 深度学习中的正则化(参数范数惩罚:L1正则化、L2正则化...

2019-03-12 13:32:27 917

原创 NPL实践系列:4、传统机器学习

1. 朴素贝叶斯的原理原理基于朴素贝叶斯公式,比较出后验概率的最大值来进行分类,后验概率的计算是由先验概率与类条件概率的乘积得出,先验概率和类条件概率要通过训练数据集得出,即为朴素贝叶斯分类模型,将其保存为中间结果,测试文档进行分类时调用这个中间结果得出后验概率。基本定义分类是把一个事物分到某个类别中。一个事物具有很多属性,把它的众多属性看作一个向量,即x=(x1,x2,x3,…,...

2019-03-09 21:50:21 481

原创 NLP实践系列:3、特征选择

1. TF-IDF原理。TF-IDF是Term Frequency - Inverse Document Frequency的缩写,即“词频-逆文本频率”。它由两部分组成,TF和IDF。前面的TF也就是我们前面说到的词频,我们之前做的向量化也就是做了文本中各个词的出现频率统计,并作为文本特征,这个很好理解。关键是后面的这个IDF,即“逆文本频率”如何理解。在上一节中,我们讲到几乎所有文本都会...

2019-03-07 21:43:52 611

原创 NLP实践系列:2、特征提取

​ 自然语言处理中,特征提取是十分重要的一环,而提取特征,主要是提取单词的特征,比如读音,和语义。这就涉及到了分词的问题。1、基本文本处理技能1.1 分词相关的概念​ 分词指的是将一个单词序列切分成一个一个单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。现有的分词方法可分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。1.2三类分词...

2019-03-05 17:38:38 1049

原创 NLP实践系列:1、探索NPL数据集

1、数据集来源中文数据集:THUCNewsTHUCNews数据子集:https://pan.baidu.com/s/1hugrfRu 密码:qfud英文数据集:IMDB数据集 Sentiment Analysis1、测试依赖包,TensorFlow版本import tensorflow as tffrom tensorflow import kerasimport nu...

2019-03-03 21:39:30 1403

原创 开发常见中的编码问题总结

开发常见中的编码问题总结开发中遇到编码问题可以说很常见,总结一下很有必要 1、编码问题可能会出现在哪些环节,那些地方?可以大致划分到两种场景:网络传输,IO操作网络传输:http传输过程中,的request,response乱码,一般是web浏览器、web容器,应用程序的编码不一致导致。数据库连接时的编码设置与应用程序不一致,也可能导致乱码,如Mysql的cline...

2018-06-14 11:51:15 667

原创 算法复杂度,时间复杂度,空间复杂度 整理汇总

算法复杂度,时间复杂度,空间复杂度算法复杂度:算法在编写成可执行程序后,运行时所需要的资源,资源包括时间资源和内存资源。其中时间资源对应时间复杂度,内存资源对应空间复杂度。考察一个算法主要从时间复杂度和空间复杂度来衡量时间复杂度时间频度 T(n)T(n)T(n)一个算法执行所消耗的时间,与算法中语句执行次数成正比,一个算法中语句执行次数称为语句频度,或时间频...

2018-03-06 10:45:38 969

原创 工作中用到的mybatis 用法小结

1、返回insert的对象的主键id在insert标签 添加 keyProperty 即可返回<insert id="insert" keyProperty="userId" parameterType="com.test.project1.User"> </insert>2、insertOrUpdate 插入或更新3、mybatis 控制...

2018-03-06 10:44:49 232

原创 常用java 命令行命令的使用及示例

1. jps :查看系统当前运行的java进程PS C:\WINDOWS\system32> jps -hillegal argument: -husage: jps [-help] jps [-q] [-mlvV] [<hostid>]Definitions: <hostid>: <hostname>[:&...

2018-02-08 18:07:22 1095

原创 ECS上安装docker运行阿里云日志服务demo

ECS上安装docker运行阿里云日志服务demoyum 安装dockeryum install dockerInstalling: docker x86_64 2:1.12.6-11.el7.centos

2017-11-07 15:01:14 479

原创 正则表达式 基础知识 备忘

相关概念:1、什么是正则表达式?描述字符串的规则的工具1、元字符 字符 作用 . 除换行符之外的任意字符 \w 字母、数字、下划线 \s 空白符 \d 任意数字 \b 单词开始 或结束 ^ 字符串开始 $ 字符串结束2、字符转义对于“ . ”、 “ * ” 、“ \ ” 等本身有特殊作用的字符的匹配,需在前面加斜杠\,如. * \ 3

2017-08-03 09:38:51 255

原创 python 基础练习

python 基础练习(官方文档地址:https://docs.python.org)1、列表排序Python Console中自定义比较函数:def com(x,y): if x>y: return 1 if x==y: return 0 return -1com(3,5)-1com(5,5)0com(6,1)1tuple与lis

2017-06-22 16:22:35 242

微机原理与接口技术课后答案

《微型计算机原理与接口技术》周荷琴_吴秀清(第三版)课后习题答案

2011-12-29

ubantu 11.4 版linux命令教程

这是关于ubantu版linux的命令教程,包括ubantu版linux的大部分常用的命令写法及意思,很有用。

2011-05-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除