- 博客(16)
- 资源 (9)
- 问答 (1)
- 收藏
- 关注
原创 C++基础知识总结(持续更新)
0.写在前面 这篇文章主要是在刷c++版本leetcode中,遇到的各种小知识点。随时刷题,随时学习,随时总结。1.数组问题1.1 一维数组(1)声明数组(需要指定元素的类型和元素的数量):type arrayName [ arraySize ];、 (2)初始化数组(使用大括号):double a[5] = {1000.0, 2.0, 3.4, 7.0, 50.0}; 如果没有规定数组大小:double a[] = {1000.0, 2.0, 3....
2020-08-30 11:44:12 578
原创 浅谈数据相关工作及其技术栈、岗位特点和核心竞争力
大家在求职过程中,不管是传统行业还是新兴互联网行业,又或是一些老牌科技公司,有很多岗位的title都和数据两个字挂钩。比如说数据工程师、数据分析师、大数据工程师、数据挖掘工程师、数据科学家等,又或是虽然没有数据二字,但是总让我们觉着和大数据关系很深,或是岗位要求技能有一些重合,看起来都和机器学习算法统计有些关联。比如算法工程师、机器学习工程师、商业分析师等,这些岗位在工作内容上有哪些区别?在公司的业务当中承担什么样的角色?各自入行所需要的硬技能门槛都是什么?各自晋升路线又是什么样子的?我们这...
2020-08-24 17:16:12 946 1
原创 手推隐马尔科夫模型HMM(Hidden Markov Model)02-Evaluation评估问题
目录1.写在前面2.Evaluation评估问题3.前向算法-Forward Algorithm(O(N·T^2))4.后向算法-Backward Algorithm(O(N·T^2))1.写在前面 上一篇博客,我们重点介绍了HMM的一些基本概念,模型定义,说明了在使用HMM模型中的两个假设,引出在HMM中的三个重要的问题。HMM模型主要是用来解决三类问题:Evaluation问题、Learning问题、Decoding问题。这篇博客我们重点讲解Evaluation问...
2020-08-23 22:20:01 382
原创 手推隐马尔科夫模型HMM(Hidden Markov Model)01-背景介绍
目录1.写在前面2.概率图模型3.HMM模型 3.1 HMM模型的5元组3.2 HMM模型中的两个假设3.3HMM模型中的三个问题1.写在前面 这篇文章带大家看一个比较有意思的模型-HMM,扩展起来就是Hidden Markov Model。HMM模型在深度学习流行之前,一直活跃在NLP领域,对该领域发展起到了非常大的作用,HMM可以处理自然语言处理和语音识别等领域。我们会在写HMM模型的过程中,将其所涉及到的知识全部串联起来。 当然了,在...
2020-08-23 14:12:25 677
原创 手推支持向量机08-约束优化问题-对偶关系之KKT条件
目录1.写在前面2.什么是KKT条件(3组,5个条件)1.写在前面 上一节,我们介绍了slater条件,假如说我们遇到一个凸优化问题+slater条件,那么一定满足强对偶关系。强对偶关系是说p*是原问题的解,d*是对偶函数的解,满足p*=d*。p*对应最优解是x*,d*对应最优解是λ*和η*。怎么求出来这三个最优解呢?KKT就给定了这三者之间的一个关系,可以求出这三个最优解。并且KKT条件和强对偶关系属于充要条件,可以互相推导。我们这一节就介绍什么是KKT条件。2.什么...
2020-08-12 19:07:26 665
原创 分词(Word Segmentation)-最大匹配算法
目录1.写在前面2.常用的分词工具3.分词算法-最大匹配-前向最大匹配(forword-max matching)3.1 算法思想3.2 前向匹配代码实现4.分词算法-最大匹配-后向最大匹配(backward-max matching)4.1 算法思想4.2 后向匹配代码实现5.最大匹配的缺点1.写在前面 我们上次总结了一个NLP系统中一般有的几个部分,包括分词、清洗数据、标准化、特征提取、建模、评估模型等。这篇文章我们重点总结分词这个部分的知识点。...
2020-08-08 23:19:13 1300
原创 NLP项目-文本处理的流程分析
大部分的NLP项目都是围绕着上面那个pipeline进行的,需要把一个原始文本经过一系列处理,把它处理成特征向量,整个的处理流程分为几个大的步骤,首先需要对文本做分词操作,分词可以分为英文分词和中文分词,英文分词比较简单,完全可以通过空格和标点符号进行区分每一个单词,中文相对困难。之后我们经常做一些数据的清洗工作,主要包括清洗一些没有的标签,比如<html>,特殊符号(!。),停用词(a an the),英文中有一个非常重要的过程就是标准化,这个操作大部分应用在英文中。标准化...
2020-08-08 17:10:17 1371
原创 通过斐波那契数列探讨时间复杂度和空间复杂度
目录1.斐波那契数简介2.计算斐波那契数3.时间复杂度计算4.空间复杂度计算5.斐波那契非递归实现6.怎么在时间复杂度O(1),空间复杂度O(1)下计算斐波那契数1.斐波那契数简介 斐波那契数列(Fibonacci sequence),又称黄金分割数列、因数学家莱昂纳多·斐波那契(Leonardoda Fibonacci)以兔子繁殖为例子而引入,故又称为“兔子数列”,指的是这样一个数列:0、1、1、2、3、5、8、13、21、34、……在数学上,斐波那契数列以如...
2020-08-08 13:31:20 9835 3
原创 P vs NP vs NP Complete vs NP Hard
目录1.写在前面2.千禧年世纪难题3.P类和NP类问题特征4.NPC问题5.NP-Hard问题6.总结1.写在前面 我们看到一个问题,经常会说:“这个没法做,是一个NP问题”,其实这句话是有问题的,我们并没有搞清楚NP问题和NPC问题,大部分情况下,我们想说的NP问题都是NPC问题,NP问题并不是没法做,NPC才是。最近看到一篇文章【我国数学家证明NP=P】,论文中结论对错我没有能力评价,从现有反馈上看,作者结论不成立可能性更大,如果能解决这个问题,几乎就是以凡...
2020-08-03 13:36:07 639 1
原创 2.1.1 hadoop体系之离线计算-hdfs分布式文件系统-hadoop简介
目录1.Hadoop介绍2.Hadoop发展简史3.Hadoop特性优点4.Hadoop国内外应用1.Hadoop介绍 Hadoop是Apache旗下的一个用java语言实现开源软件框架,是一个开发和运行处理大规模数据的软件平台。允许使用简单的编程模型在大量计算机集群上对大型数据集进行分布式处理。 狭义上说,Hadoop指Apache这款开源框架,它的核心组件有: COMMON(公共):公共工具,支撑其他Hadoop模块 ...
2020-08-02 18:21:00 373
原创 1.8.2 linux和高并发-keepalived和单点故障-keepalived安装和实验
目录1.写在前面2.keepalived的安装和配置文件说明2.1 安装概述2.2keepalived配置文件说明3.安装细节 3.1 node01使用yum安装keepalived3.2 开启一个node04做为LVS服务器3.3 node01中修改keepalived配置文件3.4 node04修改keepalived配置文件3.5 node01中启动keepalived3.6 客户端验证3.7 启动node04中keepalived服务...
2020-08-02 00:16:14 312
原创 1.8.1 linux和高并发-keepalived和单点故障-keepalived概念
目录1.写在前面2.keepalived概念说明3.工作原理3.1VRRP协议与工作原理3.2 keepalived的工作原理4.keepalived软件的功能1.写在前面 LVS存在的问题:1、LVS存在单点故障,导致服务不能访问;2、真实机存在单点故障,导致部分用户能访问。我们类比成,国王去世后究竟选择哪一个王子继位问题。2.keepalived概念说明 Keepalived是Linux下一个轻量级别的高可用解决方案。高可用(High...
2020-08-01 22:55:16 395
原创 1.7.3 linux和高并发-nginx集群和高并发-Nginx反向代理和负载均衡实战
目录1.写在前面2.实验一:实现nginx的虚拟服务器功能3.实验二:解决Nginx链接跳转问题4.实验三:nginx给两台tomcat的RealServer做负载均衡,返回Session不同并解决Session一致性的问题1.写在前面 接下来拿着Nginx做几个比较常见的实验。2.实验一:实现nginx的虚拟服务器功能 在做实验前,我们需要提前修改本机windows中host文件,设置ip与域名映射关系。 接下来,我们直接在...
2020-08-01 20:12:09 329
catVSdog_data深度学习猫狗分类任务数据集
2020-04-15
LaTex参考书籍(刘海洋入门+short快速)
2019-03-05
html5实现腾讯QQ登录界面背景动画特效(QQ背景动态)
2017-08-02
mysql创建视图遇到问题
2018-03-02
TA创建的收藏夹 TA关注的收藏夹
TA关注的人