自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(63)
  • 收藏
  • 关注

原创 循环神经网络(rnn)讲解

•    循环神经网络(rnn)•  RNN简介•  Rnn基本结构•  双向rnn基本结构•  rnn梯度消失问题•  RNN应用举例 •    RNN简介•    循环神经网络(RNN)能够从序列和时序数据中学习特征和长期依赖关系。•   循环神经网络(RNN)近几年在语言模型与文本生成,机器翻译,语音识别,图像描述生成等领域都取得了不错的效果。     •  Rnn基本结构•    回顾一下...

2018-06-12 20:59:00 3265

转载 推荐系统冷启动问题的常见解决方案

转载来自 https://www.jianshu.com/p/97e46f933010本文在《推荐系统实践》(项亮)一书的基础上介绍一下推荐系统的冷启动问题。1.冷启动问题定义推荐系统需要根据用户的历史行为和兴趣预测用户未来的行为和兴趣,对于BAT这类大公司来说,它们已经积累了大量的用户数据,不发愁。但是对于很多做纯粹推荐系统的网站或者很多在开始阶段就希望有个性化推荐应用的网站来说,如何在对用户一...

2018-03-08 17:26:00 22928 1

转载 logstic回归损失函数及梯度下降公式推导

logstic回归表1 cost函数解释x(i)每个样本数据点在某一个特征上的值,即特征向量x的某个值y(i)每个样本数据的所属类别标签m样本数据点的个数

2017-12-22 15:31:49 2976

原创 lightgbm模型fine-tune微调

1.参数input_model置为需要微调的模型,这种方式会额外增加n棵树继续学习;2.lgb.train(init_model=微调所需模型,keep_training_booster=True)model = lgb.train(params, lgb_train, num_boost_round=1000, valid_sets=lgb_eval,

2022-05-10 00:38:46 883

原创 CVR预估建模中样本的问题

1.样本选择 传统的cvr建模往往选择点击后的转化和未转化样本,这样训练出来的模型用在全量样本上进行预估,而非只对点击样本进行预估。即是说,训练数据与实际要预测的数据来自不同分布,这个偏差对模型的泛化能力构成了很大挑战,会导致样本选择偏差; 通过加入一些未点击样本作为label为0的负样本,可以缓解样本选择偏差; 选择全量样本作为训练样本,在这种策略下我们假设未点击的样本肯定不会转化,但是我们不知道当未点击用户点击了之后是否会转化,如果直接使用0作为它们...

2021-10-25 21:06:56 533

原创 剑指 Offer 16. 数值的整数次方 - python

剑指 Offer 16. 数值的整数次方 python实现描述实现函数double Power(double base, int exponent),求base的exponent次方。不得使用库函数,同时不需要考虑大数问题。示例 1:输入: 2.00000, 10输出: 1024.00000示例 2:输入: 2.10000, 3输出: 9.26100示例 3:输入: 2.00000, -2输出: 0.25000解释: 2-2 = 1/22 = 1/4 = 0.25来源:力扣(Lee

2020-12-04 16:20:51 221

原创 剑指 Offer 13. 机器人的运动范围 - python

剑指 Offer 13. 机器人的运动范围介绍地上有一个m行n列的方格,从坐标 [0,0] 到坐标 [m-1,n-1] 。一个机器人从坐标 [0, 0] 的格子开始移动,它每次可以向左、右、上、下移动一格(不能移动到方格外),也不能进入行坐标和列坐标的数位之和大于k的格子。例如,当k为18时,机器人能够进入方格 [35, 37] ,因为3+5+3+7=18。但它不能进入方格 [35, 38],因为3+5+3+8=19。请问该机器人能够到达多少个格子?来源:力扣(LeetCode)链接:https:/

2020-12-02 11:57:49 238

原创 房产行业聊天问答匹配 -pytorch方案

房产行业聊天问答匹配竞赛地址:https://www.datafountain.cn/competitions/474问题描述方案首先将该问题归结为NLP中的NSP任务(预测下一个句子),然后采用目前较为先进的基于chinese预训练的bert系的相关算法。在transformer库中这些算法的使用方式变得更为简单便捷,所以我们使用pytorch + transformer进行建模代码详细代码可见https://github.com/1JasonZhang/Q-A-matching-of-r

2020-11-17 10:08:45 774

原创 基于百度UNIT的微信智能问答聊天机器人小程序

微信聊天机器人小程序方法登录百度ai开放平台,申请百度unit智能聊天机器人,获取ak和sk密钥。将密钥复制到chat.js对应处即可。代码https://github.com/1JasonZhang/WeChat-QA-Mini-Program-based-on-baidu-UNIT测试小程序...

2020-11-05 10:43:25 1992 1

原创 顺时针打印矩阵 python

剑指 Offer 29. 顺时针打印矩阵题目描述输入一个矩阵,按照从外向里以顺时针的顺序依次打印出每一个数字。示例 1:输入:matrix = [[1,2,3],[4,5,6],[7,8,9]]输出:[1,2,3,6,9,8,7,4,5]示例 2:输入:matrix = [[1,2,3,4],[5,6,7,8],[9,10,11,12]]输出:[1,2,3,4,8,12,11,10,9,5,6,7]思路根据题目实例描述,题意为将矩阵中的元素按顺时针打印出来,方向为左->右, 上-

2020-11-03 19:38:20 731

原创 leetcode 56. 合并区间 python

问题给出一个区间的集合,请合并所有重叠的区间。示例 1:输入: intervals = [[1,3],[2,6],[8,10],[15,18]]输出: [[1,6],[8,10],[15,18]]解释: 区间 [1,3] 和 [2,6] 重叠, 将它们合并为 [1,6].示例2:输入: intervals = [[1,4],[4,5]]输出: [[1,5]]解释: 区间 [1,4] 和 [4,5] 可被视为重叠区间。来源:力扣(LeetCode)链接:https://...

2020-10-23 15:50:03 202

原创 剑指 Offer 07. 重建二叉树 - python

输入某二叉树的前序遍历和中序遍历的结果,请重建该二叉树。假设输入的前序遍历和中序遍历的结果中都不含重复的数字。例如,给出前序遍历 preorder =[3,9,20,15,7]中序遍历 inorder = [9,3,15,20,7]返回如下的二叉树: 3 / \ 9 20 / \ 15 7思路:首先通过先序遍历序列可以得到树的根节点,然后在中序序列中找到根节点的位置,则以根节点为界限,向左到0,为左子树,向右到len() - 1 位右子树,然...

2020-10-12 13:50:10 418

原创 剑指 Offer 25. 合并两个排序的链表 - python

输入两个递增排序的链表,合并这两个链表并使新链表中的节点仍然是递增排序的。示例1:输入:1->2->4, 1->3->4输出:1->1->2->3->4->4限制:0 <= 链表长度 <= 1000l1为链表1,l2为链表2思路:首先定义一个辅助链表来组成结果链表,然后从头开始遍历两个链表,比较两个链表的每个节点,将有序节点插入辅助链表中,当两个链表中某一个遍历完之后跳出迭代,另一链表剩余的节点都大于辅助链表中的节点,

2020-10-09 14:59:20 144

原创 257. 二叉树的所有路径 - python

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言 一、pandas是什么? 二、使用步骤 1.引入库 2.读入数据 总结前言二叉树为程序员面试的常见问题,本文将对leetcode中257二叉树的所有路径进行讲解。提示:以下是本篇文章正文内容,下面案例可供参考一、问题给定一个二叉树,返回所有从根节点到叶子节点的路径。说明:叶子节点是指没有子节点的节点。示例:输入: 1/ \2 3...

2020-09-04 14:04:34 425

原创 对称的二叉树- 基于python

剑指 Offer 28. 对称的二叉树问题描述请实现一个函数,用来判断一棵二叉树是不是对称的。如果一棵二叉树和它的镜像一样,那么它是对称的。例如,二叉树 [1,2,2,3,4,4,3] 是对称的。但是下面这个 [1,2,2,null,3,null,3] 则不是镜像对称的:示例 1:输入:root = [1,2,2,3,4,4,3]输出:true示例 2:输入:root = [1,2,2,null,3,null,3]输出:false思路看到这个题目首先想到了使用中序遍历,遍历整个二

2020-09-02 11:38:08 279

原创 从上到下打印二叉树-基于python

从上到下打印二叉树通过,剑指 Offer 32 - I. 从上到下打印二叉树, 剑指 Offer 32 - II. 从上到下打印二叉树 II,整理广度优先BFS方法。剑指 Offer 32 - I从上到下打印二叉树从上到下打印出二叉树的每个节点,同一层的节点按照从左到右的顺序打印。例如:给定二叉树: [3,9,20,null,null,15,7],返回:[3,9,20,15,7]思路:可以使用层次遍历方法,利用bfs广度优先遍历的方法进行遍历,然后保存到list中,广度优先遍历借

2020-09-01 14:04:52 565

原创 jupyter notebook下配置多kernel

首先创建新虚拟环境conda create -n new_env python=3.7.3然后激活虚拟环境,linux下加source,windows下直接activate new_envsource activate new_env在虚拟环境中安装nb_conda,和ipykernel,ipykernel会自动配置kernelconda install nb_condapip install ipykernel最后将kernel信息写入jupyter启动项中,--nam

2020-07-29 17:59:45 199

原创 剑指 Offer 58 - I. 翻转单词顺序 - python

输入一个英文句子,翻转句子中单词的顺序,但单词内字符的顺序不变。为简单起见,标点符号和普通字母一样处理。例如输入字符串"I am a student. ",则输出"student. a am I"。示例 1:输入: "the sky is blue"输出:"blue is sky the"示例 2:输入: " hello world! "输出:"world! hello"解释: 输入字符串可以在前面或者后面包含多余的空格,但是反转后的字符不能包括。示例 3:输入: "...

2020-07-17 11:41:03 264

原创 剑指 Offer 57 - II. 和为s的连续正数序列 - python

输入一个正整数 target ,输出所有和为 target 的连续正整数序列(至少含有两个数)。序列内的数字由小到大排列,不同序列按照首个数字从小到大排列。示例 1:输入:target = 9输出:[[2,3,4],[4,5]]示例 2:输入:target = 15输出:[[1,2,3,4,5],[4,5,6],[7,8]]来源:力扣(LeetCode)思路:采用滑动窗口方法,设置左右边界来限制窗口大小,left,right双边界也就是双指针,1.边界如何移动,初始化..

2020-07-15 14:38:37 184

原创 两数之和 - 基于python

1. 两数之和给定一个整数数组nums和一个目标值target,请你在该数组中找出和为目标值的那两个整数,并返回他们的数组下标。你可以假设每种输入只会对应一个答案。但是,数组中同一个元素不能使用两遍。示例:给定 nums = [2, 7, 11, 15], target = 9因为 nums[0] + nums[1] = 2 + 7 = 9所以返回 [0, 1]解法思路:首先想到的是利用双循环暴力搜索的解法,其时间复杂度为O(n^2),复杂度偏高。数组类问题降低时...

2020-05-26 21:49:43 205

原创 剑指offer面试题52. 两个链表的第一个公共节点 - 基于python

输入两个链表,找出它们的第一个公共节点。如下面的两个链表:在节点 c1 开始相交。示例 1:输入:intersectVal = 8, listA = [4,1,8,4,5], listB = [5,0,1,8,4,5], skipA = 2, skipB = 3输出:Reference of the node with value = 8输入解释:相交节点的值为 8 (注意,如果两个列表相交则不能为 0)。从各自的表头开始算起,链表 A 为 [4,1,8,4,5],链表 B 为.

2020-05-11 13:43:28 291 1

原创 14.不修改数组找出重复的数字 - 基于python

给定一个长度为n+1n+1的数组nums,数组中所有的数均在1∼n1∼n的范围内,其中n≥1n≥1。请找出数组中任意一个重复的数,但不能修改输入的数组。样例给定 nums = [2, 3, 5, 4, 3, 2, 6, 7]。返回 2 或 3。思考题:如果只能使用O(1)O(1)的额外空间,该怎么做呢?算法(分治,抽屉原理) O(nlogn)O(nlog...

2020-01-06 00:05:10 376

原创 python中*args和**kwargs详解

*args和**kwargs主要用于函数定义,其可以将不定数量的参数传递给一个函数。不定数量指的是预先不知道函数使用者会传递多少个参数给你,所有在这个场景下使用这两个关键字。*args是用来传递一个非键值对的可变数量的参数列表给函数。例子:def test_var_args(f_arg, *argv): print("first normal arg:", f_arg...

2019-10-12 17:58:53 279

原创 Keras防止程序占满GPU显存

在模型建立前加上即可 config = tf.ConfigProto() config.gpu_options.allow_growth=True #按需分配显存 keras.backend.set_session(tf.Session(config=config))...

2019-10-11 15:33:20 1318 2

原创 不同数据循环使用同一模型tensorflow-gpu计算图后自动释放显存

https://stackoverflow.com/questions/39758094/clearing-tensorflow-gpu-memory-after-model-execution由于tensorflow中使用完gpu后并不会自动释放显存,所以在循环利用同一个计算图时会不停的累加显存,无法释放显存。然后从网上仅发现一种可行方案,即每次执行完计算图后都关闭当前进程,然后用其他进...

2019-08-21 10:40:51 2232 4

原创 树的子结构 - 基于python

题目描述输入两棵二叉树A,B,判断B是不是A的子结构。(ps:我们约定空树不是任意一个树的子结构)思路:首先第一步在二叉树A中查找与B根节点R的值一样的节点,通常可以采用递归的方式来遍历整棵树第二步判断A中以R为根节点的子树的结构是否与B相同,这里也可以采用递归的方法,判断R的值是否与B树中根节点值是否相同,若不同则则不具有相同节点,如果相同则开始比较各自的左右节点是否相同,递归的...

2019-07-03 11:10:34 296

原创 合并排序链表 - 基于python

题目描述输入两个单调递增的链表,输出两个链表合成后的链表,当然我们需要合成后的链表满足单调不减规则。思路分析:首先要确定合并后链表的头结点,比较两个l1,l2链表的头结点小的哪一个作为新链表的头结点然后开始合并链表,比较l1,l2下一个节点的大小,小的哪一个作为新链表的下一个节点。这里要遍历其中一个链表如果l1,l2长度不同,遍历时要判断是否为空,若为空则跳出遍历。跳出遍历时l...

2019-07-02 10:52:51 464

原创 反转链表(迭代)-基于python

题目描述输入一个链表,反转链表后,输出新链表的表头。反转链表是面试的基础题,掌握是很有必要的。我们采用迭代思想进行链表反转首先我们定义三个指针,分别表示前一个节点pre,当前节点cur,中间节点temp每次循环时使得当前节点指向前一节点,然后节点后移进行下一反转。# -*- coding:utf-8 -*-# class ListNode:# def __in...

2019-07-02 10:09:04 323

原创 二维数组中的查找 and 搜索二维矩阵 II - 基于python

题目描述在一个二维数组中(每个一维数组的长度相同),每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序。请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数。现有矩阵 matrix 如下:[ [1, 4, 7, 11, 15], [2, 5, 8, 12, 19], [3, 6, 9, 16, 22], [10...

2019-06-26 11:20:38 192

原创 pandas进行分组统计

需要获取foursquare中每个用户每个签到地点的频次可以用到pandas中groupby方法data_ny.groupby(by=['userId','venueId']).size()然后将userId ,venueId,频次写入csv中userId = []venueId = []count = []for i in data_gb: userId...

2019-05-31 15:18:01 4062

原创 leetcode 旋转链表 python

给定一个链表,旋转链表,将链表每个节点向右移动k个位置,其中k是非负数。示例1:输入: 1->2->3->4->5->NULL, k = 2输出: 4->5->1->2->3->NULL解释:向右旋转 1 步: 5->1->2->3->4->NULL向右旋转 2 步: 4->...

2019-04-20 21:27:15 142

转载 Floyd判圈算法(龟兔赛跑算法)

转载自https://blog.csdn.net/xiaoquantouer/article/details/51620657一、算法简述Floyd判圈算法(Floyd Cycle Detection Algorithm),又称龟兔赛跑算法(Tortoise and Hare Algorithm),是一个可以在有限状态机、迭代函数或者链表上判断是否存在环,以及判断环的起点与长度的算法。...

2019-04-12 16:41:36 628

原创 机器、深度学习防止过拟合方法总结

1.从数据出发1.1进行数据增强,数据规范化,添加噪声数据,根据当前数据集生成一些训练数据2.使用合适的模型2.1调整网络结构,控制模型复杂度2.2设置训练早停止2.3增加正则项2.4在输入、权值中加入噪声3.结合多种模型利用集成学习的思想3.1bagging(random forest)3.2boosting(GBDT)3.3dropout...

2019-04-10 10:55:30 157

原创 XGBoost和GBDT区别

介绍了大体的四个区别,并不详细,仅做参考。1.传统GBDT以CART树作为基分类器,xgboost还支持线性分类器,可以为带L1和L2正则项的线性回归和逻辑回归。2.GBDT优化时只用到了一阶导数信息,xgboost对损失函数进行二阶泰勒展开,用到了一阶和二阶导数。3.xgboost在损失函数中加入正则项,控制模型的复杂度,防止过拟合。正则项中包含了树的叶子节点数和参数的L2范数。...

2019-04-09 21:17:42 1301

原创 数据预处理中标准化-归一化的区别

标准化:标准化需要计算特征的均值和标准差,公式表达为 归一化: 区别:简单来说,标准化是依照特...

2019-04-08 17:07:05 913

原创 机器学习中关于正则化防止过拟合的原理解析

作者:邓子明链接:https://www.zhihu.com/question/20700829/answer/119314862来源:知乎著作权归作者所有,转载请联系作者获得授权。网易云也有免费视频的,另外 coursera 有很多课程都挺不错,可以学习。The Problem of Overfitting1.What is Overfitting看预...

2019-04-03 15:27:13 1388

原创 快速排序java实现

import java.util.*;public class MyClass { //快速排序public static void quick_sort(int s[], int l, int r){ if (l < r) { //Swap(s[l], s[(l + r) / 2]); //将中间的这个数和第一个数交换 参见注1 int...

2019-04-03 15:13:18 99

原创 leetcode 实现strStr()函数

实现strStr()函数。给定一个haystack 字符串和一个 needle 字符串,在 haystack 字符串中找出 needle 字符串出现的第一个位置 (从0开始)。如果不存在,则返回-1。示例 1:输入: haystack = "hello", needle = "ll"输出: 2示例 2:输入: haystack = "aaaaa", needl...

2019-04-02 10:08:03 257

原创 Leetcode java 对角线遍历

给定一个含有 M x N 个元素的矩阵(M 行,N 列),请以对角线遍历的顺序返回这个矩阵中的所有元素,对角线遍历如下图所示。示例:输入:[ [ 1, 2, 3 ], [ 4, 5, 6 ], [ 7, 8, 9 ]]输出: [1,2,4,7,5,3,6,8,9]解释:说明:给定矩阵中的元素总数不会超过 100000 。思路:横坐标为raw ...

2019-03-30 13:47:07 835

原创 推荐系统评价指标总结

http://www.cnblogs.com/wzyj/archive/2018/05/01/8976185.html

2019-03-28 16:07:30 388

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除