自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(40)
  • 收藏
  • 关注

转载 Keras自定义损失函数的4个方法

百度能够找出来的最原始的资源貌似是这个链接,里面提供了三种方法,但是都不能解决目前我的问题,获取是我没看懂吧(主要我的custom损失函数的参数不是简单的y_true,y_pred,又是从中间层计算loss)https://spaces.ac.cn/archives/4493google出来的一个方法惊艳到我了,必须要引用在这里https://stackoverflow.com/questi...

2018-11-16 10:27:59 11996 6

转载 Java命名规范

转载自:https://www.cnblogs.com/zshibo/p/8007123.html一、命名规范1、 项目名全部小写2、 包名全部小写3、 类名首字母大写,如果类名由多个单词组成,每个单词的首字母都要大写。如:public class MyFirstClass{}4、 变量名、方法名首字母小写,如果名称由多个单词组成,每个单词的首字母都要大写。如:int index=0...

2018-10-15 16:27:14 268

原创 【数据结构与算法】子串与子序列问题

1.替换最多k字符,找到最长的xxx字符串问题描述: 有一个01字符串,有之多k次将0替换成1的机会,求最长的全1子串 输入:k=2 s=’1001010101’ 输出:5 (即‘10101’变为‘11111’) 方法1: 本质思想就是:不定长滑动窗口法,但是要保证窗口内0的个数是相同的def deal(s,k): change = 0 left = 0 ...

2018-09-07 10:30:57 944

转载 如何选择排序算法

1.排序算法时间复杂度、空间复杂度、稳定性比较 https://blog.csdn.net/yushiyi6453/article/details/76407640 2.排序算法的分类及如何选择 https://blog.csdn.net/derkampf/article/details/70183450 3.如何选择排序算法 https://www.cnblogs.com/hustdc...

2018-09-04 21:59:33 543

转载 【机器学习】数据处理与特征工程

此外特征工程中还有一个很重要的部分是特征监控,具体不知道怎么做特征有效性分析——特征重要性,权重特征监控——防止特征质量下降,影响模型效果我目前能想到的特征监控的方法大概是,每隔一段时间利用新加进来的数据优化模型时发现有一个之前很重要的特征现在居然不重要了!!!!...

2018-08-31 10:11:36 337

原创 【机器学习】好想彻底搞明白L1/L2正则

1.L1/L2的先验说到先验的概念就不得不提到贝叶斯理论的概念,由于现在大家都是提倡大数据的时代,而数据量越大,贝叶斯理论中先验的力量就会越小,但是实际上大多数模型中,尤其是今天我们说的正则化中都有着贝叶斯理论的影子。但是贝叶斯理论真的很难理解的特别透彻,L1/L2的贝叶斯理论其实就是贝叶斯线性回归啦,不过真正的贝叶斯线性回归是增量学习方法进行优化的,而不是利用梯度下降方法,因为梯度下降方...

2018-08-30 16:10:50 1528

转载 【机器学习】常见错误与问题

参考链接: 机器学习常见的六大错误 来源:36大数据 作者:LinkinPark https://www.cnblogs.com/CheeseZH/p/4096546.html机器学习算法需要注意的一些问题(二) https://blog.csdn.net/xmu_jupiter/article/details/47110363 从特征的角度选择机器学习模型 low level覆盖...

2018-08-30 10:15:30 208

转载 决策树-RF-GBDT-XGboost-LightGBM

先记录一些学习过程中看到的比较重要的点,最后再来进行大总结1.xgboost/gbdt在调参时为什么树的深度很少就能达到很高的精度?答案来源:https://www.jianshu.com/p/005a4e6ac775 也就是说,当我们训练一个模型时,偏差和方差都得照顾到,漏掉一个都不行。   对于Bagging算法来说,由于我们会并行地训练很多不同的分类器的目的就是降低这个方差(va...

2018-08-18 19:38:56 582

转载 逻辑回归常见面试题总结

转载自:https://www.cnblogs.com/ModifyRong/p/7739955.html

2018-08-17 15:40:17 4231

原创 连续特征的离散化 与 离散特征的连续化

0.前言GBDT擅长处理连续特征 LR擅长处理海量离散特征 但是整合一个数据集都既有连续特征又有分类特征,这就涉及到连续特征的离散化和离散特征的连续化了1.连续特征离散化2.离散特征连续化这篇论文详细介绍了一种根据变量的各个取值下目标变量的似然概率,将分类变量转化为连续变量的方法:https://kaggle2.blob.core.windows.net/forum-messa...

2018-08-17 15:28:34 4225 3

原创 【算法工程师】面试问题总结

算法部分机器学习部分1.SVM与LR的异同,为什么工业上更喜欢用LR? 2.什么时候需要离散化特征? GBDT VS LR 3.归一化的好处【几种归一化方法的使用场景】深度学习部分1.深度网络的计算量和参数量coding部分1.两个字符串的编辑距离...

2018-08-13 16:20:42 467

转载 推荐系统框架上的理解

深度解析京东个性化推荐系统演进史: https://blog.csdn.net/qq_40027052/article/details/78733365

2018-08-10 17:37:55 1712

转载 推荐系统算法学习(三)——经典模型LR,GBDT+LR,GBDT+FFM

知乎回答:LR,gbdt,libfm这三种模型分别适合处理什么类型的特征,为了取得较好效果他们对特征有何要求? https://www.zhihu.com/question/35821566 参考博客:这些经典模型的优缺点 https://zhuanlan.zhihu.com/p/32689178...

2018-08-10 17:08:57 9294

转载 推荐系统算法学习(二)——DNN与FM DeepFM

1.FM 与 DNN和embedding的关系先来复习一下FM 对FM模型进行求解后,对于每一个特征xi都能够得到对应的隐向量vi,那么这个vi到底是什么呢?想一想Google提出的word2vec,word2vec是word embedding方法的一种,word embedding的意思就是,给出一个文档,文档就是一个单词序列,比如 “A B A C B F G”, 希望对文...

2018-08-02 20:59:46 9833 2

转载 推荐系统算法学习(一)——协同过滤(CF) MF FM FFM

1.协同过滤(CF)优点:简单,可解释 缺点:在稀疏情况下无法工作2.MF PMF BPMF优点:更好解决可扩展性和稀疏问题而被广泛用于推荐系统 缺点:矩阵分解时间复杂度高,可采用梯度下降的方法价绍计算复杂度2.1 利用SVD求解MF参考博客:https://www.cnblogs.com/AndyJee/p/7879765.html 任意一个M*N的矩阵A(M行*N...

2018-08-02 11:15:50 27131 1

转载 推荐系统实战阅读笔记(二)

1.用户行为分为显示反馈行为和隐士反馈行为 2.用于行为的统一表示3.实验设计与测评数据集:GroupLens提供的MovieLens数据集 测评指标: 精确率/召回率: 对用户u推荐N个物品(记为R(u)),令用户u在测试集上喜欢的物品集合为T(u),然后可以通过准确率/召回率评测推荐算法的精度 覆盖率:该覆盖率表示最终的推荐列表中包含多大比例的物品...

2018-07-31 21:58:59 732

转载 推荐系统实战阅读笔记(一)

1.什么是推荐系统用户没有明确的需求,你需要的是一个自动化的工具,它可以分析你的历史兴趣,从庞大的电影库中找到几部符合你兴趣的电影供你选择。这个工具就是个性化推荐系统。推荐系统的主要任务 推荐系统的任务就是联系用户和信息,一方面帮助用户发现对自己有价值的信息,另一方面让信息能够展现在对它感兴趣的用户面前,从而实现信息消费者和信息生产者的双赢 推荐系统与搜索引擎的区别 和搜索引擎一样,...

2018-07-31 08:59:07 668

原创 面经

1.OPPO职位:AI算法工程师 总体感受:面试官人很nice,OPPO这个部门目前主要做推荐系统和广告推荐的业务,自己这方面啥也不懂,面试官还很耐心的解释,需求不大,OPPO前年在成立的部门,主要关注点不在深度学习,而是机器学习,特别是特征构建和提取。 具体问题: 1.项目说一说 2.手写一个代码:一个数组中如果有两个相同的数且像个相同的数的距离小于k,则输出Yes 3.手写一个背...

2018-07-20 11:34:36 625 1

转载 深度学习总结(一)各种优化算法

参考博文: 码农王小呆:https://blog.csdn.net/manong_wxd/article/details/78735439 深度学习最全优化方法总结: https://blog.csdn.net/u012759136/article/details/52302426 超级详细每个算法的讲解,可参考: https://blog.csdn.net/tsyccnh/articl...

2018-07-03 20:04:15 50403 9

转载 【目标检测】YOLO系列的进阶与SSD对比

一.YOLO的缺点1.YOLO 虽然能够达到实时的效果,但是其 mAP 与刚面提到的 state of art 的结果有很大的差距。 2.每个网格只预测一个物体,容易造成漏检 3.对于物体的尺度相对比较敏感,对于尺度变化较大的物体泛化能力较差 参考博客:YOLO v1~v3的历程:https://www.cnblogs.com/makefile/p/YOLOv3.html二.SSD...

2018-06-19 16:05:20 10517

转载 【目标检测】各种方法中比较难理解的地方

1.评价指标mAP全网最清楚的解释!!!,强推~! 原文链接:http://blog.sina.com.cn/s/blog_9db078090102whzw.html 理解的关键点在于每一次的precision和recall计算都是在top_X的基础上计算的!!一定要先搞清楚在目标识别中由于经常都是取top_N(N一般为5)进行输出的,所以precision和recall的定义与二分类时是...

2018-06-15 17:50:38 1648

原创 图解快速排序算法

快排是在面试时一定会被问到的算法,但是笔者总是记不住,画个图来帮助自己记忆,希望也能帮到同样记性不好的小朋友。1.快排的基本思想是冒泡排序法的升级,属于交换排序 基本思想:通过一趟排序将待排序记录分割成独立的两部分(枢纽值的左边部分和右边部分),其中一部分的关键字均比另一部分记录的关键字小,则可分别对这两部分记录继续进行排序,已达到整个序列有序的目的2.快排的图解大家都知道,枢纽...

2018-06-07 10:46:24 34368 2

转载 Ubuntu16.04安装CUDA+cuDNN+GPU版TensorFlow过程记录

参考博客先放出来感谢一波踩坑的前辈们!!!! 简书:清晰易懂 https://www.jianshu.com/p/c2215c74a8fe 过程详细: https://blog.csdn.net/ZWX2445205419/article/details/69429518...

2018-06-06 13:17:12 286

原创 字符串/数字列表的全排列和组合算法

字符串/数字列表的全排列和组合算法1. 全排列问题参考博客1:一次搞懂leetcode的全排列问题 参考博客2【超级棒的博客】:字符串的全排列组合算法1.1 下一个全排列数(leetcode31)参考博客3:https://blog.csdn.net/zr1076311296/article/details/51296008 举一个小例子: 例如 5 4 7 ...

2018-06-06 09:10:50 2247

原创 [python]变量作用域问题

python变量作用域

2017-10-31 21:16:22 403

原创 [python]报错汇总【持续更新】

1.python多线程连接mysql数据库出错:pymysql.err.InterfaceError:(0,”)这是pymysql模块自身的错误,据说在0.9版本之后都存在这个问题,解决方法: 每一个线程分别创建一个connect连接

2017-10-31 17:35:35 350

原创 【机器学习】机器学习中涉及到的距离度量

1.欧氏距离 2.曼哈顿距离 3.切比雪夫距离 4.马氏距离 5.巴氏距离 6.汉明距离 7.皮尔孙系数 8.信息熵 含义 优点 缺点 适用数据

2017-10-30 11:01:02 312

原创 python2 与 python3 不兼容问题总结【持续更新】

python2 与 python3不兼容问题

2017-09-15 14:58:02 4573

转载 python内置array模块,与numpy中的array和list之间的转换

python内置array模块这个模块定义了一个对象类型,用以表示一些基础变量构成的列表,包括字符,整数,浮点数,Array是序列类型,使用起来与list十分接近,但是存储的变量类型只能是一种,所以方便高效的数值运算。可以使用type code在创建array时指定内部变量的类型,type code定义如下表: Type code C Type Python Type Minimum

2017-09-06 11:50:07 13640 1

转载 python模块调用方法总结

python有三种导入模块的方法感谢原作者Allenw 原文地址 其一,import modname: 模块是指一个可以交互使用,或者从另一Python 程序访问的代码段。只要导入了一个模块,就可以引用它的任何公共的函数、类或属性。模块可以通过这种方法来使用其它模块的功能。用import语句导入模块,就在当前的名称空间(namespace)建立了一个到该模块的引用.这种引用必须使用全称,也就是说

2017-09-06 09:46:02 3333

转载 python编码问题

python3编码

2017-07-03 16:37:16 223

转载 python编码问题

python3编码

2017-07-03 16:35:25 194

转载 mysql彻底卸载

感谢博主:http://blog.sina.com.cn/s/blog_6fc5bfa90100qmr9.html 如果你的电脑里装过MySQL,想再重新安装MySQL的时候可能就会因为前一版本卸载不彻底而出现错误。最常见的就是安装好后设置参数的最后一步验证时,会在Execute configurattion步骤中的第三项Start Service出错,错误提示为Could not start

2017-06-30 11:26:08 1758

转载 Python 中文编码问题

Python读取文本文件的中文编码问题 http://www.cnblogs.com/mingjiatang/p/4890420.html

2017-06-04 16:45:57 299

原创 使用sklearn进行数据挖掘

http://www.cnblogs.com/jasonfreak/p/5448462.html

2017-06-03 16:26:44 493

转载 算法四类问题关系图

算法四类问题关系图存档待查

2017-04-23 20:40:03 637

原创 大话数据结构2-算法基础

算法效率的度量方法: 事后统计方法,pass收到太多因素的干扰且耗时成本巨大 事前分析估算方法: 除去软件(编译器)硬件(CPU内存影响下的运行速度)等因素,算法的效率紧紧取决于算法本身的步骤和输入数据的规模。通过计算基本操作的数量来估计算法的运行时间效率。基本操作的数量必须是输入规模的函数!! 不特意提出的话,算法的复杂度指的是时间复杂度,而时间复杂度指的是最坏情况下的时间复杂度,因为期望

2016-11-07 17:31:44 225

原创 大话数据结构学习1-数据结构绪论

数据结构: 逻辑结构面向问题,物理结构面向内存,基本目的是将数据及其逻辑关系存储到内存中 逻辑结构: 集合结构(数据元素同属于一个集合,除此之外没有任何关系) 线性结构(元素之间是一对一的关系?就是排队咯) 树形结构(一对多的层次关系,重点在于层次吧个人认为) 图形结构(多对多的关系) 物理结构/存储结构: 顺序存储: 连续的存储单元,不利于数据的删除,加入等变化,需要连续的内容空

2016-11-07 13:35:41 210

转载 Python socket基础

本文转载自:http://blog.csdn.net/rebelqsp/article/details/22109925Python 提供了两个基本的 socket 模块。   第一个是 Socket,它提供了标准的 BSD Sockets API。   第二个是 SocketServer, 它提供了服务器中心类,可以简化网络服务器的开发。下面讲的是Socket模块

2016-09-06 23:30:08 197

转载 python单元测试

python测试总体介绍:http://blog.csdn.net/xc5683/article/details/8779623python单元测试教程:http://www.ibm.com/developerworks/cn/linux/l-pyunit/

2016-08-05 15:26:28 262

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除