自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)
  • 资源 (2)
  • 收藏
  • 关注

原创 计算机笔记(9.20)

面试今天的面试真心有点尴尬,聊项目和技术都很流畅,最后死在了基础上了,整理一下面试的基础编程题:两个链表的交点反转一个字符串操作系统:线程和进程的区别计算网络:三次握手的过程ip找top-k个ip基础还是要复习好的...

2018-09-20 20:39:08 238

原创 机器学习面试题解(6-10)

1、HMM的三个基本问题先放上我完整理论的一些博客https://blog.csdn.net/Ding_xiaofei/article/details/81629479前一段时间刚刚复习过,但还是有一个想不起来了,在面试官的提醒下才答出来的。概率计算问题,已知HMM模型参数,和观测值,计算观测值出现的概率学习问题,已知观测序列,计算HMM的模型参数预测问题,解码问题,我们平时用的最多...

2018-09-19 14:34:56 338

原创 深度学习面试题解(1-5)

开篇今天面试了一下阿里高德,面试问题记录一波,面试的时候问得还是超级细的,深度学习算法和传统的学习算法都有问到,视频面的时候我也是一塌糊涂,不过居然莫名其妙的过了。1、梯度爆炸和梯度消失的问题,这里面还顺带问了一下sigmoid函数梯度的最大值(0.25)这部分我答的好像还不是很糟糕,放上我以前写的博客,作为大家的参考https://blog.csdn.net/ding_xiaofei/a...

2018-09-19 00:02:32 576

原创 计算机笔记(9.18)

机器学习中的损失函数https://blog.csdn.net/Ding_xiaofei/article/details/82756191主要是交叉熵损失函数

2018-09-18 13:21:33 230

原创 机器学习中的损失函数

开篇很多时候,机器学习的算法是可以按照损失函数来划分的,像我以前博客中提到的LR和SVM的区别,首先它们的损失函数就是不一样的。这边我还是先整理一部分损失函数,近期会逐步的完善。交叉熵损失函数交叉熵就是用来判定实际的输出与期望的输出的接近程度关于熵的一些概念,这边不多加赘述,大家可以参考我的博客这边的话,其实最开始的主要目的就是衡量两个概率分布的距离,如何是衡量两个分布的距离呢,这里需要...

2018-09-18 13:16:24 2941

原创 机器学习面试题解(1-5)

1、L1正则和L2正则的区别先放上一个参考博客https://blog.csdn.net/jinping_shi/article/details/52433975

2018-09-17 23:52:04 357

原创 计算机笔记(9.17)

##剑指offer1-5 题##机器学习面试题1-5

2018-09-17 20:39:36 197

原创 二分搜索的题目

二分搜索针对有序的数组,主要是一些边界的问题leetcode_35题解public class Leetcode_35 { public int searchInsert(int[] nums, int target) { int l = 0; int r = nums.length-1; while(l<=r...

2018-09-17 16:55:47 445

原创 各大互联网公司面经集锦(附解答)

数据库数据库多表查询 MYSQL常用引擎及其区别(innoDB、MyISAM、MEMORY区别) B树、B+树数据结构、区别 select、epoll,以及边缘触发、水平触发 数据库的索引介绍一下 MySQL用的挺多,问你一下,innodb的b+树索引,主键索引,聚簇索引有什么区别。 MySQL里有哪些锁,行锁表锁,乐观锁呢,我说了版本号和MVVC,开始问我MVVC。 事务...

2018-09-17 15:45:19 1058

原创 计算机笔记(9.14)

hdfs每个datanode上面的block是不能重复的,你的block数量是不能超过datanode的数量的,如果超过了系统就会出错Namenode metadate(元数据)写过程其实数据是不分块的,它是字节流写入,写满一个block就换下一个block...

2018-09-14 11:07:28 136

原创 一篇简短的文本摘要综述

摘要的定义对海量数据内容进行提炼与总结,以简洁、直观的摘要来概括用户所关注的主要内容,方便用户快速了解与浏览海量内容。文本摘要这篇主要讲的还是文本摘要早期论文 Luhn. The Automatic Creation of Literature Abstracts (1958)困难在哪 摘要撰写是一项高度智能,同时也很” 自由” 的任务 机器写摘要 vs. 专家写摘要...

2018-09-13 22:00:27 4901 8

原创 评论总结生成系统(应用型)

无效评论的过滤1、像电商评论中最常出现的一种评论就是无意义的符号型的评论,比如全是数字或者全是标点的那种评论,这种评论可以使用正则表达式去剔除。 2、第二种评论就是一些无意义的文本评论了,比如说京东里面经常会有一些为了获得京豆而凑字数的评论,这类的评论同样是无效评论,对于没有任何标签的原始评论,这种无效评论其实比较难以检测。这时候我们假设每条这种无效评论都包含一定的关键词,我们找出这些关键词...

2018-09-13 18:52:25 1317

原创 计算机笔记(9.13)

java容器容器中大部分的底层实现的数据结构参考博客容器中的设计模式迭代器模式 适配器模式Arraylist扩容 默认的大小是10 一般是扩容1.5倍关于arraycopy的用法HashMap的源码分析...

2018-09-13 17:56:49 198

原创 HDFS面试问题整理

1、hdfs读取流程,小文件处理 2、hdfs的数据压缩算法 3、datanode什么情况下不会进行备份 4、hdfs的体系结构 5、hdfs的存储机制 6、hdfs的基本原理 7、hdfs上传文件的流程 8、HADOOP1.0和2.0HDFS的BLOCK各为多少?...

2018-09-13 08:44:39 1945

原创 计算机笔记(9.12)

计算机网络ip的分类每一类地址都由两个固定长度的字段组成, (1)网络号 net-id:它标志主机(或路由器)所连接到的网络 (2)主机号 host-id:它标志该主机(或路由器)。 IP地址通常由点分十进制的方式来表示。根据网络号和主机号的不同,分为A,B,C,D,E类。其中,A类网络号少,网络内主机号多,通常是比较大的网络,如一个国家或者地区的网络。同理,B...

2018-09-13 08:23:03 263

原创 支持向量机(SVM)和逻辑回归(LR)

开篇为什么把这两个机器模型放在一起呢,主要是因为它们经常会在面试中同时出现,这边把它们放在一起,解析一下它们之间的联系和区别。我们先看一下问题经典算法问题 LR 与 SVM 的相同和不同? 讲一下其中的LR、SVM,以及区别和联系(2018京东算法)解析 相同点: 1、首先两个都是常用的分类算法,这边要注意的是,不要看LR带了回归二字就以为它是回归模型,其实不是,它是分类模型。...

2018-09-12 16:01:07 1262

原创 2018算法岗面试题整理

神经网络1、简述反向传播原理 (阿里),面试官微信发了一道反向传播的算数题,要求算出结果并解释 (要能计算的) 2、sigmoid和ReLU的优劣 3、梯度消失问题和损失函数有关吗? 4、Dropout为什么能防止过拟合? 5、Batch Normalization有什么好处? 6、讲讲Adam优化算法 7、能想到哪些衡量两个向量之间距离的方法(L1, L2, cosin...

2018-09-12 14:11:11 1670

原创 计算机笔记(9.11)

事务的基本概念满足ACID特性的一组操作,commit提交,rollback回滚 ACID原子性(Atomicity):事务最为不可分割的最小单元,事务的所有操作要么全部提交成功,要么全部失败回滚。回滚可以通过日志来实现,日志记录着事务所执行的修改操作,在回滚时反向执行这些修改操作即可。 一致性(Consistency):数据库在事务执行前后都保持一致性状态。在一致性状态下,所有事...

2018-09-11 22:15:20 157

原创 数据库以及SQL的一些面试题整理(2018年秋招)

1、MySQL用的挺多,问你一下,innodb的b+树索引,主键索引,聚簇索引有什么区别。 2、MySQL里有哪些锁,行锁表锁,乐观锁呢,我说了版本号和MVVC,开始问我MVVC。 3、事务的实际场景问题,两个事务,一个查一个新增,问能否查到新增的,我问他隔离级别,他说RR。MySQL的RR避免幻读,所以读不到新增数据。 4、MySQL的死锁怎么产生的,举了两个例子。 5、三个事务,两个加...

2018-09-11 16:50:26 1326

原创 计算机笔记9.10

操作系统安全性和完整性约束数据库出问题的几种原因 系统出问题 多用户的并发访问导致一致性出问题 人为的破坏(有意的-非法用户,或者无意的) 编程出错,输入数据有问题数据库的安全定义视图,某类用户只能查询这个视图,无法查询基表(权限控制)访问控制 普通用户、拥有某些资源特权的用户、数据库管理员(DBA)用户的标识和身份的验证(密码验证等等)授权 DBA授权(DBA...

2018-09-10 22:23:52 202

原创 计算机笔记(9.9)

JavaBasic缓存池new Integer(123) 与 Integer.valueOf(123) 的区别在于:new Integer(123) 每次都会新建一个对象;Integer.valueOf(123) 会使用缓存池中的对象,多次调用会取得同一个对象的引用。Integer x = new Integer(123);Integer y = new Integer(1...

2018-09-09 21:16:22 223

原创 Leetcode_79 单词搜索

题目描述这题目代码稍微多了一些,不过思路也很清晰题解javaimport java.util.*;public class Leetcode_79 { private int m; private int n; private boolean[][] visited; int[][] d = {{-1,0},{0,1},{1,0},{0,...

2018-09-06 16:22:46 189

原创 机器学习中的一些评价指标

开篇整理一些机器学习中的评价指标精确率和召回率关于定义我不多加赘述,大家可以自己搜一搜,或者说看一下我下面的参考博客。 参考博客为了帮助大家理解什么是精确率和召回率,我举下面几个例子:首先是地震预测,我有一个预测模型我的模型预测了100次地震,其中90次真的发生了地震,还有10次没有发生地震,那么它的精确度就是90% 可以和上面没有任何联系 事实上发生了100次地震,...

2018-09-05 20:48:43 219

原创 Leetcode_401 二进制手表

题目描述题解用递归回溯有点麻烦了,这是简单题,换个思路就成了,输出所有的时间,再转换成二进制,计算1的数量class Solution { public List<String> readBinaryWatch(int num) { List<String> times = new ArrayList<>(); ...

2018-09-05 14:46:01 265

原创 Leetcode_90 subset ll

题解题解import java.util.*;public class Leetcode_90 { public List<List<Integer>> subsetsWithDup(int[] nums) { List<Integer> templist = new ArrayList<>(); ...

2018-09-05 11:21:01 161

原创 Leetcode39&&Leetcode40 组合总和

题目描述题解很经典的题目import java.util.*;public class Leetcode_39 { public List<List<Integer>> combinationSum(int[] candidates, int target) { List<Integer> templist =...

2018-09-04 16:21:46 744 1

原创 Leetcode_216 组合总和 III

题目描述题解基本就和77是一样的组合问题import java.util.*;public class Leetcode_216 { public List<List<Integer>> combinationSum3(int k, int n) { List<Integer> templist = new Arr...

2018-09-01 20:43:12 413

原创 Leetcode_78 subset

题目描述我对递归和回溯的理解还是有问题,这是一道很简单的题目这边先贴一个博客参考一下 参考博客题解import java.util.*;public class Leetcode_78 { public List<List<Integer>> subsets(int[] nums) { List<Integer&gt...

2018-09-01 20:11:20 154

原创 概率无向图模型:条件随机场

开篇先来一篇博文感性认识一下什么是条件随机场 参考博客 里面的一些公式还是解释的不够清楚,所以我会结合李航老师和宏毅老师的一些内容来完善整个条件随机场的东西,希望能够帮助到大家。...

2018-09-01 17:04:15 579

原创 维特比算法和beam search

开篇这边本来是打算把维特比算法直接放到HMM那篇博客里面,但是发现自己在复习HMM的时候,对维特比的理解有一定的偏差,时不时会串线到beam search算法上,所以这边具体写一下他们之间的联系和区别。首先要给出的结论是它们是不同的算法,思想也是不一样的区别beam search 的操作属于贪心算法思想,不一定reach到全局最优解。因为考虑到seq2seq的inference阶...

2018-09-01 15:01:40 5592

中文停用词词表

中文的停用词词表,没有什么特别的介绍,相信大家都知道是用来干嘛的

2018-05-17

京东手机评论数据集

json格式的京东手机评论,详细地介绍请参照我的博客https://blog.csdn.net/Ding_xiaofei/article/details/80335279

2018-05-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除