- 博客(11)
- 收藏
- 关注
转载 机器学习算法中的基本概念
1、Model representation(模型表达) 模型表达就是给出输入和输出之间的函数关系式。当然这个函数是由前提假设的,里面可以含有参数。此时如果有许多训练样本的话,同样可以给出训练样本的平均相关的误差函数,也称作损失函数(Loss function)。我们的目标是求出模型表达中的参数,这是通过最小化损失函数来求得的。一般最小化损失函数是通过梯度下降法(即先随机给出参数的一组值,然后更新...
2020-03-02 10:26:55 284
转载 文本蕴含日记4——深度学习
1、深度学习的提出 深度学习的概念由hinton等人于2006年提出。基于深信度网(DBN)提出非监督贪心逐层训练算法,为解决深层结构相关的优化难题带来希望。随后提出多层自动编码器深层结构。此外lecun等人提出的卷积神经网络是第一个真正多层结构学习算法 ...
2020-03-01 15:37:08 410
原创 文本蕴含日记3——句子编码
1、特征构造 中文分词之后需要对数据进行特征构造,也可以说成特征转换。再处理文本数据时,基于“向量空间模型”这一概念,可以通过词袋模型、N-gram模型、词向量来进行特征构造。 (1)向量空间模型(VSM:Vector Space Moudle ) 向量空间模型把文本内容的处理简化为向量空间中的运算,并且以空间上的相似度表达语义的相似度,直观易懂。 (2)词袋模型 在传统的词袋模型中,对于每一个词...
2020-02-26 17:03:43 373
转载 C++面试准备日记——函数
1、C++中析构函数的作用 (1)析构函数与构造函数相对应,当对象结束其生命周期时系统会自动执行析构函数,析构函数用来做清理善后的工作,如释放内存空间等; (2)析构函数名应与类名相同,只是在函数名前加一个位取反符~,以区别构造函数。它不能带任何参数,也没有返回值。只能有一个析构函数,不能重载。 (3)如果用户没有编写析构函数,编译系统会自动生成一个缺省的析构函数;如果用户自定义了析构函数,编译器...
2020-02-25 22:07:44 503
转载 C++面试准备日记——static
1、C和C++的区别 (1)从设计思想上看,C++是面向对象的语言,C是面向过程的结构化编程。 (2)从语法上看,C++具有封装、继承、多态三种特性;C++增加了许多类型安全功能,比如强制类型转换;C++支持范式编程,比如模板类、函数模板等。 2、static关键字的作用 定义全局静态变量、局部静态变量、静态函数、类的静态成员、类的静态函数。 (1)全局静态变量: 在全局变量前加上关键字stati...
2020-02-24 20:23:25 111
原创 C++面试准备日记2——设计模式
1、什么是设计模式 设计模式是软件开发人员在开发过程中面临一般问题的解决方案,是经过分类编目、代码设计经验的总结,设计模式使代码真正工程化。每种模式在现实中都有相应的原理来与之对应,每种模式都描述了一个在我们周围不断重复发生的问题,以及该问题的核心解决方案。 2、设计模式的分类 设计模式可以分为三大类:创建型模式、结构型模式、行为型模式。 (1)创建型模式:提供了一种在创建对象的同时隐藏创建逻辑的...
2020-02-24 18:17:21 159
转载 文本蕴含日记2——注意力机制
1、什么是注意力机制(Attention Mechanism) 注意力Attention,人类在观察周围环境时,总会优先注意到一些部分来获取自己需要的信息,这些部分就代表了周围环境的某种描述。而注意力机制通过学习不同局部的重要性,再结合起来。对Attention常见的有三种理解: (1)从数学公式和代码实现上attention可以理解为加权求和; (2)从形式上attention可以理解为键值查询...
2020-02-24 15:02:11 306
原创 C++面试准备日记1——redis
1、redis是什么? redis(重申)是一个开源的、基于内存的、key-value数据库,并提供多种语言的API。 redis是一个存储系统,它指出存储的value类型相对多,包括string、list(链表)、set(集合)、zset(有序集合)。这些数据类型都支持push/pop、add/remove等操作。redis为了保证效率,将数据缓存在内存中,同时会周期性的把更...
2020-02-23 12:44:08 357
原创 文本蕴含日记1——中文分词
1、什么是分词 分词是指将连续的字序列按照一定的规范重新组合成词序列的过程。简而言之,就是将一个句子中的字重新划分组合成词。 2、为什么要强调中文分词技术 之所以特地强调中文分词,是因为中文在行文上的特殊性。 以英文为代表的拉丁语系语言,英文以空格作为天然的分隔符,而中文词语之间没有分隔。古代汉语中除了连绵词和人名地名等,词通常就是单个汉字,所以当时没有分词书写的必要。而现代汉语中双字或多字词居多...
2020-02-22 17:47:01 376
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人