自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 资源 (1)
  • 收藏
  • 关注

原创 Python基础教程-第4章-字典

可通过名称来访问其各个值的数据结构。这种数据结构称为映射(mapping)。字典是Python中唯一的内置映射类型,其中的值不按顺序排列,而是存储在键下。4.1 字典的用途字典(日常生活中的字典和Python字典)旨在让你能够轻松地找到特定的单词(键),以获悉其定义(值)。# 如果要创建一个小型数据库,在其中存储这些人的电话号码,该如何办呢?# 列表方法names = ['Alice',...

2019-01-31 11:45:15 236

原创 Python基础教程-第3章-字符串

3.1 字符串基本操作所有标准序列操作(索引、切片、乘法、成员资格检查、长度、最小值和最 大值)都适用于字符串,但别忘了字符串是不可变的。3.2 设置字符串的格式:精简版在%左边指定一个字 符串(格式字符串),并在右边指定要设置其格式的值。format = "Hello, %s. %s enough for ya?" values = ('world', 'Hot')format % ...

2019-01-30 21:38:02 197

原创 LeetCode509. Fibonacci Number题解

问题描述  斐波那契数列定义为F(n)。其中F(0) = 0 F(1) = 1F(N) = F(N - 1) + F(N - 2), for N > 1.输入输出样例Input: 2Output: 1Explanation: F(2) = F(1) + F(0) = 1 + 0 = 1.Input: 3Output: 2Explanation: F(3) = F(2...

2019-01-22 22:44:36 305

原创 Python基础教程-第2章-序列

  Python中最基本的数据结构是序列(sequence)。序列中的每个元素都有编号,也叫位置或索引。2.1 序列概述  Python中内置了多种序列。最常见的两种:列表和元组,字符串也属于序列的一种。  列表和元组的区别在于列表是可以修改的,而元素不可以修改。元组使用小括号,列表使用方括号。需要注意的是序列中的元素可以是不同类型的元素(整型、浮点、字符串、数组等)edward = ['...

2019-01-22 21:34:04 523

原创 平安科技实习生面试经历

主要是结合简历来看。对应于Neo4j、Python以及机器学习问题记录自我介绍项目介绍Python sort 按照dict 长度排序sort(key)中应用一个lambda表达式Cypher 查找不存在就并删除mergeJava中list的arraylist 和hashlist 的区别是什么?D3 内部用的什么类forcePython 传值还是传参贝叶...

2019-01-16 15:56:57 3941 1

原创 NLP面试题目26-30

26. GRUGRU即Gated Recurrent Unit。前面说到为了克服RNN无法很好处理远距离依赖而提出了LSTM,而GRU则是LSTM的一个变体,当然LSTM还有有很多其他的变体。GRU保持了LSTM的效果同时又使结构更加简单,所以它也非常流行。而GRU模型如下,它只有两个门了,分别为更新门和重置门,即图中的zt和rt。更新门用于控制前一时刻的状态信息被带入到当前状态中的程度,更新...

2019-01-16 02:04:18 2196

原创 NLP面试题目21-25

21.LR和SVM的联系与区别?联系:1、LR和SVM都可以处理分类问题,且一般都用于处理线性二分类问题(在改进的情况下可以处理多分类问题)2、两个方法都可以增加不同的正则化项,如L1、L2等等。所以在很多实验中,两种算法的结果是很接近的。区别:1、LR是参数模型,SVM是非参数模型。2、从目标函数来看,区别在于逻辑回归采用的是Logistical Loss,SVM采用的是hinge ...

2019-01-15 23:29:22 3103

原创 NLP面试题目16-20

16.决策树有哪些常用的启发函数?如何对决策树进行剪枝?引言  决策树是一种自上向下,对样本数据进行树形分类的过程。结点分为内部结点和叶节点。每个内部结点代表一个特征,叶节点代表类别。从顶部根节点开始,所有样本聚在一起。经过根节点的划分,样本被划分到不同子节点,再根据子节点特征进一步划分,直到所有样本都被归到某一个类别(叶节点)。  决策树可用于分类与回归问题,应用于集成学习可得到随机森林、...

2019-01-15 23:14:17 5574

原创 NLP面试题目汇总11-15

10.知道哪些命名实体识别算法?具体的优缺点?(Bi-LSTM-CRF)参考链接-机器之心NER简介  命名实体识别是自然语言处理中的一项基本任务。命名实体一般指文本中具有特定意义或指代性强的实体。通常包括人名、地名、组织机构名、日期时间、专有名词等。NER系统就是从非结构化的输入文本中抽取出上述实体,并且可以按照业务需求识别出更多类别的实体。  [地位]NER可以看作词法分析中未登录词识...

2019-01-15 00:40:50 3963 1

原创 NLP面试题目6-10

6.LSTM中各模块分别使用什么激活函数,可以使用别的激活函数吗?激活函数选取  关于激活函数的选取。在LSTM中,遗忘门、输入门、输出门使用Sigmoid函数作为激活函数;在生成候选记忆时,使用双曲正切函数Tanh作为激活函数。  值得注意的是,这两个函数都是饱和的,也就是在输入达到一定值的情况下,输出不会发生明显变化。如果是非饱和的激活函数,比如ReLU,那么就难以实现门控的效果。...

2019-01-14 22:57:49 8058

原创 NLP面试题目汇总1-5

1.有哪些文本表示模型,它们各有什么优缺点?文本表示模型是研究如何表示文本数据的模型,输入是语料库(文档)。知识点:词袋模型TF-IDFN-gram词袋模型与N-gram最基本的文本表示模型是词袋模型(Bag of Words)。基本思想是把每篇文章看成一袋子词,并忽略每个词出现的顺序。具体来看:将整段文本表示成一个长向量,每一维代表一个单词。该维对应的权重代表这个词在原文章中的...

2019-01-14 01:10:31 22491 1

原创 NLP常用知识点总结

出于面试的需要,需要总结下自然语言处理的方方面面和常用知识点NLP领域首先总结NLP主要研究问题:机器翻译实体识别文本分类问答系统自动摘要情感分析阅读理解对话机器人机器写作语音识别NLP研究方法1.语言模型定义通过语料计算某个句子出现的概率(概率表示)应用输入法语音识别消除歧义给定拼音串 ta shi yan yan jiu saun fa de可能...

2019-01-13 22:16:56 1563

原创 电影KBQA-4

D2RQ SPARQL endpoint与两种交互方式这次我们介绍利用D2RQ开启SPARQL endpoint服务和两种交互方式:在浏览器中进行查询或者编写python脚本进行交互。一、SPARQL endpointSPARQL endpoint是SPARQL协议的一部分,用于处理客户端的请求,可以类比web server提供用户浏览网页的服务。通过endpoint,我们可以把数据发布在网...

2019-01-09 00:21:33 480

原创 电影KB-QA 3

通过前面几篇文章的介绍,读者应该对知识图谱,其相关概念,以及语义网技术栈中的RDF,RDFS/OWL有了一定的了解。者准备开一个实践篇,结合理论篇,让读者能够从无到有构建一个领域知识图谱,并在其上搭建一个基于知识图谱的问答小程序。demo比较简单,问答实现是基于模板匹配和正则表达式,整个流程是为了让读者对知识图谱及其相关应用有个直观的认识。首先介绍我们使用的数据、数据来源和数据获取方法;其次,...

2019-01-08 23:51:18 682

原创 电影KBQA-2

知识图谱的基石:RDF本文将结合实例,对RDF和RDFS/OWL,这两种知识图谱基础技术作进一步的介绍。其实,RDF、RDFS/OWL是类语义网概念背后通用的基本技术,而知识图谱是其中最广为人知的概念。RDF表现形式RDF(Resource Description Framework),即资源描述框架,其本质是一个数据模型(Data Model)。它提供了一个统一的标准,用于描述实体/资源。...

2019-01-08 19:56:58 387

原创 电影KBQA-1

知识图谱知识图谱有了一个初步的印象,其本质是为了表示知识。它背后的思想可以追溯到上个世纪五六十年代所提出的一种知识表示形式——语义网络(Semantic Network)。语义网络由相互连接的节点和边组成,节点表示概念或者对象,边表示他们之间的关系。知识图谱则更偏重于描述实体之间的关联。知识图谱是由一些相互连接的实体和他们的属性构成的。换句话说,知识图谱是由一条条知识组成,每条知识表示为一...

2019-01-08 19:08:39 800

原创 Java学习路径

1.基础知识首推《Java核心技术》,体系完整,实例多,可操作性强。主要前6章,也就250页,一个月搞定。建议:调通代码 课后作业 写笔记 分门别类保存demo代码2.SpringJava EE中,Spring和核心库同等重要。最核心概念IOC和AOP。掌握这两个概念,再把Spring MVC学会。推荐用书《Spring实战》。还有一本《Spring源码深度解析》,对Spring的...

2019-01-08 12:42:22 131

原创 CS224笔记-第一讲-深度自然语言处理

slides链接what is natural language processing?natural language processing是下面学科的交叉计算机人工智能语言学目标:让计算机理解自然语言让计算机理解和表示自然语言是一个很难的目标NLP level上图是NLP的层次,输入分别是语音和文本,经过语音分析或分词,然后经过词性分析、句法分析、语义分析、输出到...

2019-01-05 00:37:58 237

原创 【剑指Offer】第7题-重建二叉树-Python

题目描述输入某二叉树的前序遍历和中序遍历的结果,请重建出该二叉树。假设输入的前序遍历和中序遍历的结果中都不含重复的数字。例如输入前序遍历序列{1,2,4,7,3,5,6,8}和中序遍历序列{4,7,2,1,5,3,8,6},则重建二叉树并返回。(事实上,返回的是二叉树的根节点)思路前序 [1,2,4,7,3,5,6,8]后序 [4,7,2,15,3,8,6]前序遍历的第一个是根节点1...

2019-01-03 20:27:40 464

原创 机器学习-李宏毅-Lecture1-Regression-Case Study课程笔记

链接pdfRegression股价预测 输入是历史 输出是明日股价自动驾驶 输入是路况 输出是方向盘角度推荐系统 输入是使用者和商品 输出是推荐的商品example预测神奇宝贝进化后的CP值,用来判断是否进化。第一步 model寻找一个function set,比如:y=b+w∗xcpy=b+w*x_{cp}y=b+w∗xcp​w和b可以是无穷的。表示成线性形式:y=b+...

2019-01-03 15:52:34 286

原创 【剑指Offer】第4题-二维数组的查找-Python

一、题目:二维数组中的查找题目:在一个二维数组中,每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序。请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数。例如下面的二维数组就是每行、每列都递增排序。如果在这个数组中查找数字7,则返回true;如果查找数字5,由于数组不含有该数字,则返回false。Leetcode对应题目:Search a 2D ...

2019-01-02 21:13:58 154

原创 机器学习-李宏毅-Lecture0-Introduction课程笔记

链接videopdfAI ML DL关系人工智能(AI)是我们要追求的目标。机器学习(ML)是使用的手段,指机器通过学习可以和人一样聪明。而深度学习(DL)是机器学习中的一种方法,指很多层网络叠加起来。如下图所示。Why ML?使用规则可以解决一部分问题,但是难以考虑到所有的情况,永远无法超越创造者,没有freestyle。What is ML?机器学习其实所做的就是寻找一...

2019-01-02 20:11:15 226

转载 Memory Network学习笔记

引言Memory Networks是由Facebook的Jason Weston等人提出的一个神经网络框架,通过引入长期记忆组件(long-term memory component)来解决神经网络长程记忆困难的问题。在此框架基础上,发展出许多Memory Networks的变体模型。出现原因seq2seq中的记忆依靠rnnCell或者lstmCell实现,但是rnn和lstm的记忆能力实在...

2019-01-02 18:54:50 411

原创 小白机器学习之路

虽然已经二年级了,但是对于机器学习、深度学习、自然语言处理等等知识仍然不成体系。这会制约自己的发展。痛定思痛,决定从现在开始,把自己当成一个小白,认真学习基础知识,主要以CSDN博客为主,配合其他教程、教材、视频。争取学一个会一个,搭建完整知识体系,加油

2019-01-02 14:59:56 423

原创 【剑指Offer】第3题-数组中重复的数字-Python

题目介绍题目:在一个长度为n的数组里的所有数字都在0到n-1的范围内。数组中某些数字是重复的,但不知道有几个数字重复了,也不知道每个数字重复的次数。请找出数组中任意一个重复的数字。例如如果输入长度为7的数组{2,3,1,0,2,5,3},那么对应的输出是重复的数字2或者3.类比题目有:https://leetcode-cn.com/problems/find-the-duplicat...

2019-01-01 22:05:55 418 1

UML复习PPT

本PPT是UML的复习资料,有各种图的例题,有助于UML的复习

2015-07-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除