自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(70)
  • 收藏
  • 关注

原创 中文文本分类实战--模型选取以及融合

1.模型选取模型选择上,我选取了Lightgbm,XGboost,CNN,RNN,LSTM模型,目前搭好了模型可以跑通,机器学习的准确率可以达到0.96,由于神经网络我只训练了一次,准确率没有机器学习高,也达到了0.92,后期我会在研究模型,也非常乐意一起讨论,先和大家分享下,我在github上更新了源码,大家可以关注下,如果要在本地跑通需要关注readme修改下数据集的位置1.1 XGb...

2019-12-11 20:44:21 1182

原创 中文文本分类实战--数据处理部分

之前用智源上面一个虚假新闻检测的比赛练了练手,数据集可以在比赛官网上下载task1。可以看成中文文本分类任务,之前只是跑了跑模型,没有关注词向量的训练以及多模型融合。目前我在细化,会不断和大家分享,相互学习,欢迎交流,结束后我会把代码更新github任务介绍虚假新闻文本检测:文本是新闻信息的主要载体,对新闻文本的研究有助于虚假新闻的有效识别。具体任务为:给定一个新闻事件的文本,判定该事件属...

2019-11-29 17:01:39 2376

原创 Leetcode--78. Subsets

Given a set ofdistinctintegers,nums, return all possible subsets (the power set)Note:The solution set must not contain duplicate subsetsExample:Input: nums = [1,2,3]Output:[ [3], [1],...

2019-11-07 20:18:42 177

原创 Dynamic Memory Networks for Visual and Textual Question Answering 论文阅读笔记

原文链接1. 文章亮点提出了一个新 input 模块,使用 sentence reader 和 input fusion layer 两级编码器,信息在句子间可以流动 memory 中,使用 facts的全局知识计算现有GRU的公式中的 attention 门2. 背景介绍memory network能够推理出自然语言或三元组(主题,关系,对象)的 facts Attentio...

2019-10-20 15:30:55 369

原创 剑指offer+面试题11-查找和排序-旋转数组的最小数字(java解答)

题目把一个数组最开始的若干元素搬到数组的末尾,即数组的旋转。输入一个递增排序数组的一个旋转,输出旋转数组的最小元素。例如:数组{3,4,5,1,2}为{1,2,3,4,5}的一个旋转,该数组的最小值为1。思路旋转后的数组实际可以划分为两个排序的子数组用两个指针分别指向数组的第一个元素和最后一个元素(图a) 找到数组的中间元素,根据数组大小移动P1/P2到该位置-->保证...

2019-10-11 22:56:46 129

原创 常见查找和排序算法及java实现

我创建了一个Search包,在packageSearch内实现的算法,可以根据创建的包进行修改或者不加。顺序查找二分查找、插值查找、斐波那契分块查找二叉树查找哈希查找我创建了一个sort类,对多种排序算法的实现进行了总结归纳...

2019-10-02 16:11:55 330

原创 leetcode+排序和搜索+ 合并两个有序数组

给定两个有序整数数组nums1 和 nums2,将 nums2 合并到nums1中,使得num1 成为一个有序数组。说明:初始化nums1 和 nums2 的元素数量分别为m 和 n。你可以假设nums1有足够的空间(空间大小大于或等于m + n)来保存 nums2 中的元素。示例:输入:nums1 = [1,2,3,0,0,0], m = 3nums2 = ...

2019-09-27 23:04:17 150

原创 剑指offer+面试题10-递归和循环-斐波那契数列(java解答)

递归和终止递归:在一个函数内部调用这个函数自身循环:通过设置计算的初始值及终止条件,在一个范围内重复运算对比:递归实现代码更简洁,更易于实现 递归是函数自身调用,有时间和空间消耗(效率差,可能出现调用栈溢出) 递归中很多计算是重复的(用递归思路分析,自下而上循环实现)题目写一个函数,输入n,求斐波那契数列的第n项三种方法的代码实现1. 迭代:效率很低有很多...

2019-09-25 23:47:39 180

原创 论文实现篇 Attention Is All You Need (Transformer) -- Tensorflow

本篇论文是论文Attention Is All You Need (Transformer)的Tensorflow实现。在github上面找到了一个Tensorflow的实现代码,我跑了数据处理部分,模型训练我的笔记本跑不起来,所以只跑了一个step得到训练前的翻译情况和对应损失,和大家一起分析下别人跑出来的结果。具体模型可以参考我的另一篇博客参数定义:我们首先建立一个flags.py...

2019-09-23 12:11:18 977 2

原创 剑指offer+面试题9-栈和队列-用两个栈实现队列(java解答)

题目描述用两个栈实现一个队列。思路利用具体的例子,画图进行抽象所有到来的元素都压入stack1 将stack1的元素逐个弹出压入stack2,则stack2中的顺序正好和原来stack1相反 当stack2不为空,stack2栈顶的元素是最先进入队列的元素,可以弹出 当stack2为空,把stack1中所有元素逐个压入stack2,再从stack2直接弹出时间复杂度:O...

2019-09-21 22:29:29 128

原创 剑指offer+面试题8-二叉树-二叉树的下一个节点(java解答)

题目描述给定一棵二叉树和其中一个节点,如何找出中序遍历序列的下一个节点?树中的结点有三个指针:左子节点,右子节点,父节点思路若一个节点有右子树,则其下一个节点是它的右子树中的最左子节点,即从右子节点出发一直沿着指向左子节点的指针 一个节点没有右子树,若该节点是其父节点的左子节点,则其下一个节点是它的父节点 一个节点没有右子树,且是其父节点的右子节点,则沿父节点一直向上遍历,直到找到...

2019-09-20 08:25:50 177

原创 leetcode+二叉树+将有序数组转换为二叉搜索树

将一个按照升序排列的有序数组,转换为一棵高度平衡二叉搜索树。本题中,一个高度平衡二叉树是指一个二叉树每个节点的左右两个子树的高度差的绝对值不超过 1。示例:给定有序数组: [-10,-3,0,5,9],一个可能的答案是:[0,-3,9,-10,null,5],它可以表示下面这个高度平衡二叉搜索树: 0 / \ -3 9 / /-10...

2019-09-15 13:57:17 558

原创 剑指offer+面试题7-二叉树-重建二叉树(java解答)

题目描述输入某二叉树前序遍历和中序遍历的结果,重建该二叉树。思路二叉树的构建可以划分为构建左右子树两个小问题,大小问题本质一致,可以递归实现根据前序遍历的第一个数字创建根结点 在中序遍历序列找到根结点的位置 确定左右子树节点数量时间复杂度:O(N) 空间复杂度:O(1)二叉树的定义及打印重建二叉树的代码实现public BinaryTreeNode Constr...

2019-09-14 20:07:50 134

原创 Attention Is All You Need阅读笔记

论文链接文章亮点文章提出了一种新的简单网络架构--Transformer完全基于Attention机制 完全免除迭代和卷积迭代模型同时考虑输入的符号位置和输出序列,这种固有的顺序特性限制了训练样例的并行化。对于较长的序列,内存更是约束了样例的批处理 Attention机制允许对依赖关系进行建模,不需要考虑他们在输入或输出序列的距离,但大多数都与递归网络结合使用Transform...

2019-09-14 14:04:54 206

原创 leetcode+二叉树+对称二叉树

给定一个二叉树,检查它是否是镜像对称的。例如,二叉树[1,2,2,3,4,4,3] 是对称的。 1 / \ 2 2/ \ / \3 4 4 3但是下面这个[1,2,2,null,3,null,3] 则不是镜像对称的: 1 / \ 2 2 \ \ 3 3方法一:递归思路:如果一个树的左子树与右子树镜像对...

2019-09-13 16:43:58 142

原创 leetcode+二叉树+二叉树的层次遍历

给定一个二叉树,返回其按层次遍历的节点值。 (即逐层地,从左到右访问所有节点)。例如:给定二叉树:[3,9,20,null,null,15,7], 3 / \ 9 20 / \ 15 7返回其层次遍历结果:[ [3], [9,20], [15,7]]方法一:递归思路:比较访问节点所在层次level和当前最高层次len...

2019-09-12 23:47:50 112

原创 leetcode+二叉树+验证二叉搜索树

给定一个二叉树,判断其是否是一个有效的二叉搜索树。假设一个二叉搜索树具有如下特征:节点的左子树只包含小于当前节点的数。节点的右子树只包含大于当前节点的数。所有左子树和右子树自身必须也是二叉搜索树。示例1:输入: 2 / \ 1 3输出: true示例2:输入: 5 / \ 1 4 / \ 3 6输出:...

2019-09-12 20:03:08 139

原创 leetcode+二叉树+二叉树的最大深度

给定一个二叉树,找出其最大深度。二叉树的深度为根节点到最远叶子节点的最长路径上的节点数。说明:叶子节点是指没有子节点的节点。示例:给定二叉树 [3,9,20,null,null,15,7], 3 / \ 9 20 / \ 15 7返回它的最大深度3 。TreeNode的代码链接代码实现链接方法一:递归深度优先遍历时间复杂...

2019-09-08 18:21:11 119

原创 剑指offer+面试题6-链表-从尾到头打印链表(java解答)

题目描述输入一个链表,按链表值从尾到头的顺序返回一个ArrayList。思路1. 将链表中链接节点的指针反转,从头到尾输出。但该方法改变了原来链表的结构2. 栈:从头到尾遍历,从尾到头输出时间复杂度:O(N) 每个节点均遍历,然后栈顶元素依次输出 空间复杂度:O(N) 创建一个堆栈,将链表的所有节点,从头到尾入栈,再从尾到头出栈3. 递归:本质是一个栈结构每访问一个节点...

2019-09-05 11:02:37 103

原创 leetcode+链表+环形链表

给定一个链表,判断链表中是否有环。为了表示给定链表中的环,我们使用整数 pos 来表示链表尾连接到链表中的位置(索引从 0 开始)。 如果 pos 是 -1,则在该链表中没有环。示例 1: 输入:head = [3,2,0,-4], pos = 1 输出:true解释:链表中有一个环,其尾部连接到第二个节点。示例2: 输入:head = [1,2], pos = 0 输出:true...

2019-09-04 17:32:55 86

原创 leetcode+链表+回文链表

请判断一个链表是否为回文链表。示例 1:输入: 1->2输出: false示例 2:输入: 1->2->2->1输出: true进阶:你能否用O(n) 时间复杂度和 O(1) 空间复杂度解决此题?1. 边界情况:head==null // 空链表,回文,返回truehead.next==null // 只有一个节点的列表,回文,返回...

2019-09-01 13:59:40 99

原创 leetcode+链表+合并两个有序链表

将两个有序链表合并为一个新的有序链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。示例:输入:1->2->4, 1->3->4输出:1->1->2->3->4->4可以递归调用函数代码如下:/** * Definition for singly-linked list. * public class ...

2019-08-29 17:15:22 84

原创 leetcode+链表+反转链表

反转一个单链表。示例:输入: 1->2->3->4->5->NULL输出: 5->4->3->2->1->NULL进阶:你可以迭代或递归地反转链表。你能否用两种方法解决这道题?拿到题目第一反应是从头节点遍历到尾节点,新建一个链表进行存储并返回。但该方法时间复杂度O(n^2),空间复杂度O(n)方法一:迭代在遍...

2019-08-05 11:23:50 193

原创 leetcode+链表+删除链表的倒数第N个节点

给定一个链表,删除链表的倒数第n个节点,并且返回链表的头结点。示例:给定一个链表: 1->2->3->4->5, 和 n = 2.当删除了倒数第二个节点后,链表变为 1->2->3->5.说明:给定的 n保证是有效的。思路,利用两个指针进行操作,两个指针都初始化为头指针,将一个指针后移n位若其后为空,说明链表长度恰好为n,删...

2019-08-03 21:13:33 91

原创 leetcode+链表+删除链表中的节点

请编写一个函数,使其可以删除某个链表中给定的(非末尾)节点,你将只被给定要求被删除的节点。现有一个链表 --head =[4,5,1,9],它可以表示为:示例 1:输入: head = [4,5,1,9], node = 5输出: [4,1,9]解释: 给定你链表中值为5的第二个节点,那么在调用了你的函数之后,该链表应变为 4 -> 1 -> 9.示例 2:...

2019-08-03 12:08:35 128

原创 CS224n - 任务3 - 2. RNN解决命名实体问题

给定输入,每个RNNcell使用sigmoid函数得到隐藏状态向量。 然后我们使用隐藏状态来预测每个时间步的输出:为了训练模型,我们对每个预测的标记使用交叉熵损失:(a) i. RNN模型:有个参数,有个参数基于window的模型:有个参数ii. 预测长T的句子标签的时间复杂度:: : :(b)很难直接对F1进行优化F1不可微分 需要从整个...

2019-08-02 16:21:59 164

原创 CS224n - 任务3 - 命名实体窗

输入序列:一个长度为T的输入序列 输出序列:长度为T的输出序列 和是one-hot向量,用于表示句子中第t个单词的索引号 :将周围个标记连接到的左侧和右侧构造输入 通过在句首尾部加<start>和<end>,每个输入和输出具有统一的长度(和1),我们使用简单的前馈神经网络从预测作为从每个窗口预测标签的简单有效模型我们使用具有ReLU激活的单个隐藏...

2019-07-25 09:37:35 159

原创 剑指offer+面试题5的相关题目-合并两个有序数组(java解答)

给定两个有序整数数组nums1 和 nums2,将 nums2 合并到nums1中,使得num1 成为一个有序数组。说明:初始化nums1 和 nums2 的元素数量分别为m 和 n。你可以假设nums1有足够的空间(空间大小大于或等于m + n)来保存 nums2 中的元素。示例:输入:nums1 = [1,2,3,0,0,0], m = 3nums2 = ...

2019-07-23 16:45:44 268 1

原创 剑指offer+面试题5-字符串-替换空格(java解答)

我们介绍Java数据类型string stringbuffer和stringbuilder三者的区别String是安全的、不可变的。对已经存在的String对象的修改都是创建一个新的对象保存新的值。适用于字符串的内容不经常改变的情况,如常量声明,少量变量运算。 StringBuffer是线程安全的可变字符序列,直接对StringBuffer对象进行操作,但不能修改。所有操作类似于串行顺序...

2019-07-23 10:06:14 122

原创 leetcode+字符串+最长公共前缀

编写一个函数来查找字符串数组中的最长公共前缀。如果不存在公共前缀,返回空字符串""。示例1:输入: ["flower","flow","flight"]输出: "fl"示例2:输入: ["dog","racecar","car"]输出: ""解释: 输入不存在公共前缀。说明:所有输入只包含小写字母a-z。Leetcode中有一个网页说的很详细,介绍了水平...

2019-07-23 09:07:15 164

原创 [LeetCode] 字符串+报数

报数序列是一个整数序列,按照其中的整数的顺序进行报数,得到下一个数。其前五项如下:1. 12. 113. 214. 12115. 1112211被读作"one 1"("一个一") , 即11。11 被读作"two 1s"("两个一"), 即21。21 被读作"one 2", "one 1"("一个二","一个一...

2019-07-22 09:15:59 105

原创 [LeetCode] 字符串+实现strStr()

实现strStr()函数。给定一个haystack 字符串和一个 needle 字符串,在 haystack 字符串中找出 needle 字符串出现的第一个位置 (从0开始)。如果不存在,则返回-1。示例 1:输入: haystack = "hello", needle = "ll"输出: 2示例 2:输入: haystack = "aaaaa", needl...

2019-07-19 10:02:47 169

原创 CS224n - 任务2 - 依赖性分析

这篇博客,我们实现一个基于神经网络的依赖性分析器,这是CS224n任务2的第2题。我们逐步解析,从而实现基于转移的解析。stack:当前正在处理的单词,初始化为[ROOT] buffer:尚未处理的单词,初始化为按顺序包含句子的所有单词的缓冲区 list:解析器预测的依赖关系,初始化为空[]每次迭代,解析器将转换应用于部分解析,直到buffer为空并且stack大小为1:SHIFT:...

2019-07-16 09:03:40 538

原创 剑指offer+面试题3-数组中重复的数字(java解答)

题目一:在一个长度为n的数组里的所有数字都在0到n-1的范围内。 数组中某些数字是重复的,但不知道有几个数字是重复的。也不知道每个数字重复几次。请找出数组中任意一个重复的数字。 例如,如果输入长度为7的数组{2,3,1,0,2,5,3},那么对应的输出是第一个重复的数字2。考点:对一维数组的理解及编程能力:一维数组在内存中占据连续的空间,因此我们可以根据下标定位对应元素 分析问题的能力:通...

2019-07-15 09:33:30 150

原创 CS224n - 任务2 - Tensorflow建模

本博客介绍了tensorflow建模过程以及一些常用的tensorflow函数TensorFlow官方文档中有很多详细介绍,我主要说了下建模过程我们将实现一个具有损失函数的线性分类器:其中是特征的行向量,是模型的权重矩阵。我们将使用TensorFlow的自动微分功能为给定数据拟合模型。(a) softmax函数的实现:(具体参考q1_softmax.py)def so...

2019-07-10 22:35:34 182

原创 [LeetCode] 字符串+字符串转换整数 (atoi)

字符串转换整数 (atoi)请你来实现一个atoi函数,使其能将字符串转换成整数。首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。当我们寻找到的第一个非空字符为正或者负号时,则将该符号与之后面尽可能多的连续数字组合起来,作为该整数的正负号;假如第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成整数。该字符串除了有效的整数部分之后也...

2019-07-08 15:09:05 82

原创 [LeetCode] 字符串+验证回文字符串

验证回文字符串给定一个字符串,验证它是否是回文串,只考虑字母和数字字符,可以忽略字母的大小写。说明:本题中,我们将空字符串定义为有效的回文串。示例 1:输入: "A man, a plan, a canal: Panama"输出: true示例 2:输入: "race a car"输出: falseimport java.util.Set;import j...

2019-07-08 10:10:51 147

原创 [LeetCode] 字符串+有效的字母异位词

给定两个字符串s和t,编写一个函数来判断t是否是s的字母异位词。示例1:输入: s = "anagram", t = "nagaram"输出: true示例 2:输入: s = "rat", t = "car"输出: false说明:你可以假设字符串只包含小写字母。进阶:如果输入字符串包含 unicode 字符怎么办?你能否调整你的解法来应对...

2019-07-03 21:51:01 123

原创 [LeetCode] 字符串+ 字符串中的第一个唯一字符

给定一个字符串,找到它的第一个不重复的字符,并返回它的索引。如果不存在,则返回 -1。案例:s = "leetcode"返回 0.s = "loveleetcode",返回 2.注意事项:您可以假定该字符串只包含小写字母。import java.util.Set;import java.util.HashSet;import java.util.Linked...

2019-07-03 16:58:28 150

原创 CS224n - Assignment1 - Sentiment Analysis

代码链接,在原有代码做了些小的修改,适用于python3.64 Sentiment Analysis (20')对于Stanford Sentiment Treebank数据集中的每个句子,我们使用该句子中所有单词向量的平均值作为特征,从而预测情绪水平。我们将训练softmax分类器,并执行train / dev验证以改进分类器的泛化能力。(a) 句子的特征表示:取句子中单词向量的...

2019-07-02 10:25:26 251

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除