自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(48)
  • 资源 (2)
  • 收藏
  • 关注

原创 机器学习笔记

开篇拖了很久,才开始复习一些机器学习模型,这边依旧是一个检索目录,本目录下面的博客可能不会太过精美,甚至很多公式可能就是手写的,但是希望能够浅显的帮助大家复习和学习机器学习的一些知识,当然有代码的还是会奉上一些代码索引机器学习中的隐变量和隐变量模型概率图模型隐马尔可夫模型...

2018-08-30 14:58:19 380

原创 大数据笔记

介绍主要分为两个部分,首先是大数据的概述,会介绍各种类型的大数据框架和相应的技术,其次是spark的笔记大数据原理大数据笔记(一):HDFSIntellij idea下hadoop的开发环境搭建和相应的编程实践(HDFS)大数据笔记(二):HBase大数据笔记(三):Map-Reduce大数据笔记(四):Hive大数据笔记(五):Hadoop大数据笔记(六):S...

2018-08-08 09:19:17 547

原创 深度学习理论笔记和实战源码解读

开篇同样是一个检索目录,希望能够帮助自己和大家学习和复习相关的理论知识,同时我也会定期放上一些源码的解读。目录

2018-08-03 08:31:54 443

原创 Leetcode_77 组合问题

题目描述题解javaimport java.util.*;public class Leetcode_77 { public List<List<Integer>> combine(int n, int k) { List<List<Integer>> ret = new ArrayLis

2018-08-30 10:38:40 446

原创 Leetcode_47 全排列II

题目描述题解我用了46递归回溯的方法,然后用set去除了重复的元素 没想到也能直接提交通过class Solution { boolean[] isUsed = new boolean[10000]; public List<List<Integer>> permuteUnique(int[] nums) { L...

2018-08-23 15:09:10 284

原创 Leetcode_46 全排列

题目描述题解javajava里面不可以在方法里面定义全局变量import java.util.*;public class Leetcode_46 { boolean[] isUsed = new boolean[10000]; public List<List<Integer>> permute(int[] nums) {...

2018-08-23 11:48:14 213

原创 Leetcode_131 分割回文串

题目描述题解class Solution { public List<List<String>> partition(String s) { List<List<String>> ret = new ArrayList<>(); if(s.length()==0) ...

2018-08-22 16:34:23 432

原创 Leetcode_93 复原IP地址 (递归与回溯)

题目描述题解和17的思路基本是一样的,主要多了几个判定条件 除了单个要小于256,还有就是不能出现01,010这种import java.util.*;public class Leetcode_93 { public List<String> restoreIpAddresses(String s) { List<String&g...

2018-08-22 14:43:48 1023

原创 数据结构与算法:排序

准备待排序的元素需要实现 Java 的 Comparable 接口,该接口有 compareTo() 方法,可以用它来判断两个元素的大小关系。研究排序算法的成本模型时,计算的是比较和交换的次数。使用辅助函数 less() 和 swap() 来进行比较和交换的操作,使得代码的可读性和可移植性更好。public abstract class Sort <T extends Com...

2018-08-17 16:04:55 269

原创 Leetcode_202 快乐数

题目描述(查找类题目)题解pythonclass Solution: def isHappy(self, n): """ :type n: int :rtype: bool """ ss = set(); while True: if n == ...

2018-08-16 17:33:14 286

原创 Leetcode_524 通过删除字母匹配到字典里最长单词

题目描述题解被这个字典序坑死了class Solution { public String findLongestWord(String s, List<String> d) { Collections.sort(d); //先做个字典序的排序吧 int maxIndex = 0; int ma...

2018-08-16 09:54:20 645

原创 Leetcode_141 环形链表

题目描述判断一个链表是否有环题解public class Solution { public boolean hasCycle(ListNode head) { if(head==null) return false; ListNode slow = head; ListNode fast = he...

2018-08-15 18:11:58 157

原创 Leetcode_88 合并两个有序数组

题解题解class Solution: def merge(self, nums1, m, nums2, n): """ :type nums1: List[int] :type m: int :type nums2: List[int] :type n: int :rtype:...

2018-08-15 17:14:05 188

原创 Leetcode_680 验证回文字符串 Ⅱ

题目描述题解又被细节坑死的题目class Solution { public boolean validPalindrome(String s) { int count = 1; int l = 0; int r = s.length()-1; while(l<r) { if(s....

2018-08-15 16:24:00 222

原创 Leetcode-633 平方数之和

题目描述题目描述class Solution { public boolean judgeSquareSum(int c) { int l = 0; int r = (int) Math.sqrt(c); while(l<=r) { if(l*l+r*r==c) ...

2018-08-15 15:08:40 646

原创 Leetcode_6 Z字形变换

题目描述题解class Solution { public String convert(String s, int numRows) { if(numRows<=1) return s; StringBuilder[] sb = new StringBuilder[numRows]; for(...

2018-08-15 09:01:31 210

原创 Leetcode_34 寻找目标数字在数组里面的范围

题目描述java我写的垃圾代码,中间还出错了好几次。class Solution { public int[] searchRange(int[] nums, int target) { int[] ret = {-1,-1}; int l = 0; int r = nums.length-1; while...

2018-08-14 14:54:15 319

原创 Leetcode_648 词根替换单词

题目描述题解javapublic String replaceWords(List<String> dict, String sentence) { Set<String> set = new HashSet<>(dict); StringBuilder sb = new StringBuilder(); ...

2018-08-14 08:50:36 649

原创 概率图模型(HMM)

开篇拖了很久,现在补上概率图的几个模型,陆续补上这部分的内容。概率算是机器学习里面比较抽象和难以理解的模型,它很多时候被应用在自然语言上的一些基本,想是词性标注,命名实体。...

2018-08-13 14:32:39 2700

原创 排序不支持原生比较的对象

问题你想排序类型相同的对象,但是他们不支持原生的比较操作。解决方案内置的 sorted() 函数有一个关键字参数 key ,可以传入一个 callable 对象给 它,这个 callable 对象对每个传入的对象返回一个值,这个值会被 sorted 用来排序 这些对象。比如,如果你在应用程序里面有一个 User 实例序列,并且你希望通过他们 的 user_id 属性进行排序,你可以提供...

2018-08-13 09:44:42 196

原创 Leetcode 143 重新排列链表

题目描述题解这里涉及到三个链表的基本操作,这是一道很经典的链表操作题目首先是寻找链表的中点,设置两个指针,一快 一慢 其次是反转链表,这是非常常见的一个链表操作,很容易出错 最后是两个链表的交叉连接java代码public void reorderList(ListNode head) { if(head == null) ...

2018-08-13 09:27:21 298

原创 Leetcode_437 路径总和 III

题目描述root = [10,5,-3,3,2,null,11,3,-2,null,1], sum = 8 10 / \ 5 -3 / \ \ 3 2 11 / \ \3 -2 1Return 3. The paths that sum to 8 are:1. 5 -> 32. 5 -> ...

2018-08-10 19:08:46 398

原创 Leetcode_129 求根到叶子节点数字之和

题目描述给定一个二叉树,它的每个结点都存放一个 0-9 的数字,每条从根到叶子节点的路径都代表一个数字。例如,从根到叶子节点路径 1->2->3 代表数字 123。计算从根到叶子节点生成的所有数字之和。说明: 叶子节点是指没有子节点的节点。示例 1:输入: [1,2,3] 1 / \ 2 3输出: 25解释:从根到叶子节点路径 1-&...

2018-08-10 16:50:56 455

原创 Seq2Seq+Attention+Beam Search

开篇Seq2Seq算是我NLP里面接触比较早的模型,它来源于机器翻译,我用来做文本自动摘要。当然它在文本自动摘要领域的效果并不好。Seq2SeqSeq2Seq本质上是条件生成模型(Conditional Generation),在现有的模型中,看图说话(Image caption)也是类似的条件生成模型,它们的结构很类似,如下图所示 都是Encoder-Decoder的结构。...

2018-08-10 10:59:03 2195

原创 百度开源的问答系统框架:ANYQ

AnyQgithub地址 AnyQ(ANswer Your Questions) 开源项目主要包含面向FAQ集合的问答系统框架、文本语义匹配工具SimNet。问答系统框架采用了配置化、插件化的设计,各功能均通过插件形式加入,当前共开放了20+种插件。开发者可以使用AnyQ系统快速构建和定制适用于特定业务场景的FAQ问答系统,并加速迭代和升级。SimNet是百度自然语言处理部于2013...

2018-08-10 09:23:39 8887 1

原创 如何构建一个问答机器人(FAQ问答机器人)

开篇下面的主要内容摘自腾讯知文的算法负责人的演讲,主要描述了腾讯知文问答系统的主要框架。问答类型第一种类型,任务驱动型。这种类型通常是用户希望去完成一些任务,比如查天气、查汇率等。第二种类型,解决用户信息获取类的问题。这种类型也是我们这次分享的重点,我们将主要在这点展开。这也是目前业界落地最多的一种问答系统类型。第三种类型,通用闲聊型。比如微软的小冰、苹果的 Siri 都支持通...

2018-08-10 09:01:32 9919 1

原创 机器学习策略

评价指标查准率(precision)和查全率(recall)翻译很贴近它要表达的意思 恩达举的例子 查准率的定义是在你的分类器标记为猫的例子中,有多少真的是猫。所以如果分类器A有95%的查准率,这意味着你的分类器说这图有猫的时候,有95%的机会真的是猫。查全率就是,对于所有真猫的图片,你的分类器正确识别出了多少百分比。实际为猫的图片中,有多少被系统识别出来?如果分类器A查全率是...

2018-08-08 20:33:10 414

原创 神经网络训练的一些建议(Batch Normalization)

数据的归一化先放上宏毅大神的图,说明一下我们为什么要做数据的归一化 说明:x2的变化比较大,使用w2方向上就显得比较陡峭(梯度),学习率就不能设置得过大。Batch Normalization为什么要有batch normalization 主要是避免internal covariate shift,如图所示,输出上下波动太大(如同第二个人)的话会影响整个模型的训练...

2018-08-07 20:56:10 2594

原创 Java集合整理(主要是常用集合的使用)

开篇之前写过一篇java的数据结构,里面的内容有点不够清晰,今天在这边整理出java标准库里面的一些数据结构,也就是java中的集合。主要是为了实际的应用,所以如果想看源码解析的童鞋可以关闭这篇博客了。collection接口ListArrayList初始化的四种方法 ArrayList a = new ArrayList(); a.add(&

2018-08-06 15:15:52 359

原创 Leetcode_257 二叉树的所有路径

题目描述给定一个二叉树,返回所有从根节点到叶子节点的路径。 说明: 叶子节点是指没有子节点的节点。示例:输入: 1 / \2 3 \ 5输出: ["1->2->5", "1->3"]解释: 所有根节点到叶子节点的路径为: 1->2->5, 1->3

2018-08-05 17:13:10 190

原创 leetcode_404 左叶子之和

题目描述计算给定二叉树的所有左叶子之和。 示例: 3 / \ 9 20 / \ 15 7在这个二叉树中,有两个左叶子,分别是 9 和 15,所以返回 24题解class Solution { public int sumOfLeftLeaves(TreeNode root) { if(root==null)...

2018-08-04 16:30:10 255

原创 leetcode_222 完全二叉树的节点个数

题目描述给出一个完全二叉树,求出该树的节点个数。说明:完全二叉树的定义如下:在完全二叉树中,除了最底层节点可能没填满外,其余每层节点数都达到最大值,并且最下面一层的节点都集中在该层最左边的若干位置。若最底层为第 h 层,则该层包含 1~ 2h 个节点。示例:输入: 1 / \ 2 3 / \ /4 5 6输出: 6题解使用层次遍历,出...

2018-08-04 15:56:00 288

原创 leetcode_101 对称二叉树

题解给定一个二叉树,检查它是否是镜像对称的。例如,二叉树 [1,2,2,3,4,4,3] 是对称的。 1 / \ 2 2 / \ / \3 4 4 3但是下面这个 [1,2,2,null,3,null,3] 则不是镜像对称的: 1 / \ 2 2 \ \ 3 3题解:class Solut...

2018-08-04 14:16:09 438

原创 leetcode_112 路径总和

题目描述给定一个二叉树和一个目标和,判断该树中是否存在根节点到叶子节点的路径,这条路径上所有节点值相加等于目标和。说明: 叶子节点是指没有子节点的节点。示例: 给定如下二叉树,以及目标和 sum = 22, 5 / \ 4 8 / / \ 11 13...

2018-08-04 11:47:24 316

原创 leetcode_226 翻转二叉树

题目描述翻转一棵二叉树。输入: 4 / \ 2 7 / \ / \1 3 6 9输出: 4 / \ 7 2 / \ / \9 6 3 1java里面没有直接可以用的swap函数,所以这边采用c++的代码/** * Definition for a binary tree n...

2018-08-04 10:43:53 187

原创 leetcode_111 二叉树的最小深度

题目描述给定一个二叉树,找出其最小深度。最小深度是从根节点到最近叶子节点的最短路径上的节点数量。说明: 叶子节点是指没有子节点的节点。示例:给定二叉树 [3,9,20,null,null,15,7], 3 / \ 9 20 / \ 15 7返回它的最小深度 2.题解/** * Definition for a bin...

2018-08-04 10:22:49 210

原创 神经网络训练的一些建议(优化算法)

mini-batch梯度下降法相信有一定深度学习常识的人都知道梯度下降 使用batch梯度下降法时,每次迭代你都需要历遍整个训练集,可以预期每次迭代成本都会下降,所以如果成本函数J是迭代次数的一个函数,它应该会随着每次迭代而减少,如果J在某次迭代中增加了,那肯定出了问题,也许你的学习率太大。使用mini-batch梯度下降法,如果你作出成本函数在整个过程中的图,则并不是每次迭代都是下...

2018-08-03 15:46:20 3616

原创 神经网络训练的一些建议(方差和偏差的问题:正则化)

参数和超参数算法中的learning rate a(学习率)、iterations(梯度下降法循环的数量)、L(隐藏层数目)、n(隐藏层单元数目)、choice of activation function(激活函数的选择)都需要你来设置,这些数字实际上控制了最后的参数W和b的值,所以它们被称作超参数。实际上深度学习有很多不同的超参数,之后我们也会介绍一些其他的超参数,如momentum、...

2018-08-03 10:08:28 6560 3

原创 leetcode_3 无重复字符的最长子串

题目描述给定一个字符串,找出不含有重复字符的最长子串的长度。示例:给定 "abcabcbb" ,没有重复字符的最长子串是 "abc" ,那么长度就是3。给定 "bbbbb" ,最长的子串就是 "b" ,长度是1。给定 "pwwkew" ,最长子串是 "wke" ,长度是3

2018-08-02 23:16:05 165

原创 leetcode_209 长度最小的子数组

题目描述给定一个含有 n 个正整数的数组和一个正整数 s ,找出该数组中满足其和 ≥ s 的长度最小的连续子数组。如果不存在符合条件的连续子数组,返回 0。 示例:输入: s = 7, nums = [2,3,1,2,4,3]输出: 2解释: 子数组 [4,3] 是该条件下的长度最小的连续子数组。题解class Solution: def minSubArra...

2018-08-02 15:14:36 408

中文停用词词表

中文的停用词词表,没有什么特别的介绍,相信大家都知道是用来干嘛的

2018-05-17

京东手机评论数据集

json格式的京东手机评论,详细地介绍请参照我的博客https://blog.csdn.net/Ding_xiaofei/article/details/80335279

2018-05-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除