*晴儿*-CSDN博客

原创【产品笔记】5.敏捷产品管理

敏捷与SCRUM 基本概念：必须要懂的敏捷的事情传统软件产品研发困难：需求管理、估算（需求拆分成任务，当对需求没那么清楚的时候，和实际的时间，有很大偏差）、变更管理、质量管理、员工感受（如果有需求的改变，用户无法容忍过长时间，需要加班去实现）我们产生了大量的用不着的功能：经常或总是被用到的功能：20%，很少或从不被用到的功能64%市场瞬息万变：商场需求多样性持续上升，需求的个性化持续上升，产品创新性要求持续上升，全球一体化持续上升。变更带来的痛点：把资源更...

2020-12-30 21:44:11 358

原创【论文笔记】M-Walk: Learning to Walk over Graphs using Monte Carlo Tree Search

本文用了强化学习，在知识图谱上游走，寻找目标节点。一、简介大概意思就是，在知识图谱上，给出一个起始节点和查询（query），然后找到目标节点。图G包含节点和边。如下图，给出起始节点Obama，query：citizenship，目标节点是USA。我们要学习一个方法来预测。我们我们将f作为强化学习力的agent。他要学习搜索策略（search policy）训练的时候，我们给出，让f自己学习路径，如果他走到，就给他一个正的reward，或者0分。学完后只给出，预测...

2020-09-25 19:14:19 1157

原创【产品笔记】4.卓越用户体验

用户体验与价值什么是用户体验UCD 以用户为中心的设计不是技术多就很厉害，是否能把我用户需求和技术实现的平衡所有用户感受到的，通过接触你的产品或服务或品牌的各个点，都是用户体验签字压缩时间，导致后面隐藏成本比较高。通过设计，达到用户喜欢的特定点，就会得到很好的汇报。好用、减少时间其次。（←与设计有关）...

2020-07-13 17:07:11 915

原创【论文笔记】Deep Reinforcement Learning for Page-wise Recommendations

1、Introduction这里主要介绍了：强化学习是可以根据用户实时的反馈，捕捉用户的动态喜好，，实时更新策略（policy），还能实现长期收益的最大化。与其他不同的是，这里是生成一个网页的物品（网页版商城），是2D的，而不是1D的流式推荐（手机版商城）。（ps：对于手机用户来说，一般用户最关注的是第一个商品，把他最感兴趣的放在第一个就好了，但是对于页面来说，很难说用户最喜欢关注哪个地方，每个人的关注点可能不太一样，第一行第一个不一定是最好的，所以需要学习。）2、模型结构2...

2020-07-12 14:27:21 1055 5

原创【产品笔记】3.产品经理实战

1、团队合作2、产品设计到立项3、项目启动到产品上线4、产品上线后的运营产品=商业模式+功能+设计+技术+内容产品的成功归功于整个团队的精诚合作；产品的失败只归咎于产品负责人。用户运营：拉新，留存，老用户召回内容运营：内容质量、数量，设计规则让好的内容展现，设计机制使得用户贡献好的内容并从中获得收益，内容消费市场运营：通过市场活动、病毒式传播等，推广，让更...

2020-06-03 15:44:01 1171

原创【产品笔记】2.互联网产品修炼

如何做正确的产品（战略），比正确的作产品（执行）更重要正确的产品，在正确的时间，正确的做出来。选择比努力更重要。产品的本质、规律用户域市场是检验产品价值的唯一标准：任何产品价值的唯一衡量标准就是他的目标用户及市场产品守恒定律：1、你的产品多给力，用户就给你多少力2、产品价值量守恒3、产品复杂度守恒产品使人的交互更简单了，那么隐藏在产品背后的复杂性就增加...

2020-03-20 18:42:14 1328 3

原创【产品笔记】1.什么是精益产品探索

为什么会有这个需求，用户是否需要，对不对如果需求从一开始就错了，后面也不会发展很好大多数产品失败，是因为没人需要，而不是设计的问题。我们要学习，在市场中什么人可用，什么人不可用。没有商业计划能够在遇到客户后幸存——Steve Blank《四步创业法》精益产品探索是什么?精益产品探索是创新商业和产品的一种方法，它依靠验证式学习法，科学实验，和迭代产品发布来缩短产品开发系统...

2020-03-04 10:34:11 697

原创李宏毅强化学习笔记【5.Imitation Learning】

如果没有reward，怎么办和环境互动，但不能得到reward，只能看着expert的demonstration学习。判断开车撞人扣多少分很难，收集人开车的例子，人对话的例子是比较简单的。不知道怎么定reward，但可以收集范例。1.Behavior Cloningexpert做什么，机器就做什么一样的事情。收集expert的state和action，然后学习一个ne...

2020-01-28 11:24:48 581

原创李宏毅强化学习笔记【4.Sparse Reward】

没有reward，训练很难。因为一开始机器什么都不知道，就靠随机。如果随机一个概率特别小的才有reward，reward非常稀疏，就非常难学习，因为做什么动作都一样糟糕。1.reward shaping环境有一个固定的reward。我们还可以设计一些reward，这些不是真正的reward，但是可以引导机器去做一些你想要他做的事情。增加好奇心：鼓励冒险，真实的s与n...

2020-01-27 13:11:02 646

原创李宏毅强化学习笔记【3.Actor-Critic】

复习策略梯度policy gradient计算在某一个state，采取action a的概率。到游戏结束为止，获得多少reward。G很不稳定。除非sample很多。复习Q-learning用期望代替sample，value-based第一种方法算V，用π和环境做互动，看到s之后，累计reward期望值是多少。第二种方法，用π，当再s采取a，累计reward是多少...

2020-01-25 19:58:45 425

原创李宏毅强化学习笔记【2.Qlearning】

Qlearning value-based学习critic：并不直接采取行为，只评价现在的行为有多好/不好。假设现在actor叫π，看到state s，累计reweard的期望有多大。第一个游戏图，未来可能会获得很多分数。第二个，可能分数很少（怪少，防护罩消失）。critic：给出state，给定π，才能算得多少分。不是单独评价state的好坏。怎么预测Monte-C...

2020-01-23 15:01:47 498

原创李宏毅强化学习笔记【1.PPO】

策略梯度Policy Gradientpolicy决定actor的行为，给定一个输入，输出行为公式和之前讲的一样R是一个τ的总分！！！！！！！！！！！不是单个s，a的rewardtip1：add baseline 之前说过tip2：这个action之前的reward与这个action无关，所以只计算该action和action之后的reward。...

2020-01-17 17:47:23 402

原创李宏毅强化学习笔记【0.强化学习导论】

agent观察（observation即为state）environmentagent对做一些动作（action），影响environment因为有一些影响，environment给agent一些reward，告诉他是好的影响还是坏的影响agent要学习，如何采取动作才能让期望的reward最大有时候reward很稀疏，大部分为0（什么都没发生），只有少数有数值，这是一个...

2020-01-14 16:14:04 478

原创【论文笔记】ANR: Aspect-based Neural Recommender 基于方面的神经网络推荐系统

【大概记录一下这篇论文和思考】ANR: Aspect-based Neural Recommender 基于方面的神经网络推荐系统作者大大：Jin Yao Chin，Kaiqi Zhao，Shafiq Joty，Gao Cong（Nanyang Technological University, Singapore.）现状：用户评论是非常重要的数据，可以了解用户的喜好和关注点...

2019-09-18 21:10:15 2137 1

翻译【文章翻译+笔记】Towards the Next Generation of Recommender Systems:A Survey of the State-of-the-Art and Pos

Towards the Next Generation of Recommender Systems:A Survey of the State-of-the-Art and Possible Extensions下一代推荐系统：最新技术和可能扩展的综述作者：Gediminas Adomavicius and Alexander Tuzhilin【渣渣晴手翻，只可意会】Ab...

2019-08-03 15:39:06 11992

原创 LeetCode 103.二叉树的锯齿形层次遍历

给定一个二叉树，返回其节点值的锯齿形层次遍历。（即先从左往右，再从右往左进行下一层遍历，以此类推，层与层之间交替进行）。例如：给定二叉树[3,9,20,null,null,15,7], 3 / \ 9 20 / \ 15 7返回锯齿形层次遍历如下：[ [3], [20,9], [15,7]]渣渣晴分了左右两边讨...

2019-03-21 10:15:33 183

原创 LeetCode 143.重排链表

给定一个单链表 L：L0→L1→…→Ln-1→Ln ，将其重新排列后变为： L0→Ln→L1→Ln-1→L2→Ln-2→…你不能只是单纯的改变节点内部的值，而是需要实际的进行节点交换。示例 1:给定链表 1->2->3->4, 重新排列为 1->4->2->3.示例 2:给定链表 1->2->3->4->5, 重...

2019-02-21 11:21:38 229

原创 LeetCode 28.实现strStr()

实现 strStr() 函数。给定一个 haystack 字符串和一个 needle 字符串，在 haystack 字符串中找出 needle 字符串出现的第一个位置 (从0开始)。如果不存在，则返回 -1。示例 1:输入: haystack = "hello", needle = "ll"输出: 2示例 2:输入: haystack = "aaaaa", needl...

2019-02-21 09:30:19 116

原创 LeetCode 27.移除元素

给定一个数组 nums 和一个值 val，你需要原地移除所有数值等于 val 的元素，返回移除后数组的新长度。不要使用额外的数组空间，你必须在原地修改输入数组并在使用 O(1) 额外空间的条件下完成。元素的顺序可以改变。你不需要考虑数组中超出新长度后面的元素。示例 1:给定 nums = [3,2,2,3], val = 3,函数应该返回新的长度 2, 并且 nums 中的前...

2019-02-20 15:58:59 128

原创 LeetCode 26.删除排序数组中的重复项

给定一个排序数组，你需要在原地删除重复出现的元素，使得每个元素只出现一次，返回移除后数组的新长度。不要使用额外的数组空间，你必须在原地修改输入数组并在使用 O(1) 额外空间的条件下完成。示例 1:给定数组 nums = [1,1,2], 函数应该返回新的长度 2, 并且原数组 nums 的前两个元素被修改为 1,2。你不需要考虑数组中超出新长度后面的元素。示例 2:...

2019-02-20 15:26:26 93

原创 LeetCode 24.两两交换链表中的节点

给定一个链表，两两交换其中相邻的节点，并返回交换后的链表。你不能只是单纯的改变节点内部的值，而是需要实际的进行节点交换。示例:给定 1->2->3->4, 你应该返回 2->1->4->3. # Definition for singly-linked list.# class ListNode:# def __init...

2019-02-19 11:11:11 136

原创 LeetCode 23.合并K个排序链表

合并 k 个排序链表，返回合并后的排序链表。请分析和描述算法的复杂度。示例:输入:[ 1->4->5, 1->3->4, 2->6]输出: 1->1->2->3->4->4->5->6 渣渣晴在认真的处理链表……然鹅……# Definition for singly-linked li...

2019-02-18 16:22:04 123

原创 LeetCode 22.括号生成

给出 n 代表生成括号的对数，请你写出一个函数，使其能够生成所有可能的并且有效的括号组合。例如，给出 n = 3，生成结果为：[ "((()))", "(()())", "(())()", "()(())", "()()()"] class Solution: def generateParenthesis(self, n): "&q

2019-02-18 15:09:37 126

原创 LeetCode 21.合并两个有序链表

将两个有序链表合并为一个新的有序链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。示例：输入：1->2->4, 1->3->4输出：1->1->2->3->4->4 # Definition for singly-linked list.# class ListNode:# def __init__...

2019-02-18 11:29:32 98

原创 LeetCode 101.对称二叉树

给定一个二叉树，检查它是否是镜像对称的。例如，二叉树 [1,2,2,3,4,4,3] 是对称的。 1 / \ 2 2 / \ / \3 4 4 3但是下面这个 [1,2,2,null,3,null,3] 则不是镜像对称的: 1 / \ 2 2 \ \ 3 3说明:如果你可以运用递归和迭代两种方法解决...

2019-02-18 10:12:09 137

原创 LeetCode 20.有效的括号

给定一个只包括 '('，')'，'{'，'}'，'['，']' 的字符串，判断字符串是否有效。有效字符串需满足：左括号必须用相同类型的右括号闭合。左括号必须以正确的顺序闭合。注意空字符串可被认为是有效字符串。示例 1:输入: "()"输出: true示例 2:输入: "()[]{}"输出: true示例 3:输入: "(]"输出: false...

2019-02-14 15:07:01 106

原创 LeetCode 17.电话号码的字母组合

给定一个仅包含数字 2-9 的字符串，返回所有它能表示的字母组合。给出数字到字母的映射如下（与电话按键相同）。注意 1 不对应任何字母。示例:输入："23"输出：["ad", "ae", "af", "bd", "be", "bf", "cd", "ce", "cf"]. 渣渣晴难得

2019-02-14 11:40:24 210

原创 LeetCode 10.正则表达式匹配

给定一个字符串 (s) 和一个字符模式 (p)。实现支持 '.' 和 '*' 的正则表达式匹配。'.' 匹配任意单个字符。'*' 匹配零个或多个前面的元素。匹配应该覆盖整个字符串 (s) ，而不是部分字符串。说明:s 可能为空，且只包含从 a-z 的小写字母。 p 可能为空，且只包含从 a-z 的小写字母，以及字符 . 和 *。示例 1:输入:s = "aa"p...

2019-02-13 14:20:59 150

原创 LeetCode 14.最长公共前缀

编写一个函数来查找字符串数组中的最长公共前缀。如果不存在公共前缀，返回空字符串 ""。示例 1:输入: ["flower","flow","flight"]输出: "fl"示例 2:输入: ["dog","racecar","car"]输出: ""解释: 输入不存在公共前缀。说明:所有输入

2019-02-13 10:04:39 126

原创 LeetCode 13.罗马数字转整数

罗马数字包含以下七种字符: I， V， X， L，C，D 和 M。字符数值I 1V 5X 10L 50C 100D 500M 1000例如，罗马数字 2 写做 II ，即为两个并列的 1...

2019-02-12 16:53:18 194 1

原创 LeetCode 12.整数转罗马数字

罗马数字包含以下七种字符： I， V， X， L，C，D 和 M。字符数值I 1V 5X 10L 50C 100D 500M 1000例如，罗马数字 2 写做 II ，即为两个并列的 1...

2019-02-12 15:58:52 146

原创 LeetCode 11.盛水最多的容器

给定 n 个非负整数 a1，a2，...，an，每个数代表坐标中的一个点 (i, ai) 。在坐标内画 n 条垂直线，垂直线 i 的两个端点分别为 (i, ai) 和 (i, 0)。找出其中的两条线，使得它们与 x 轴共同构成的容器可以容纳最多的水。说明：你不能倾斜容器，且 n 的值至少为 2。图中垂直线代表输入数组 [1,8,6,2,5,4,8,3,7]。在此情况下，容器能够容纳水（...

2019-02-12 15:18:45 204

原创 LeetCode 9.回文数

判断一个整数是否是回文数。回文数是指正序（从左向右）和倒序（从右向左）读都是一样的整数。示例 1:输入: 121输出: true示例 2:输入: -121输出: false解释: 从左向右读, 为 -121 。从右向左读, 为 121- 。因此它不是一个回文数。示例 3:输入: 10输出: false解释: 从右向左读, 为 01 。因此它不是一个回文...

2019-02-11 18:14:39 139

原创 LeetCode 8.字符串转换整数（atoi）

请你来实现一个 atoi 函数，使其能将字符串转换成整数。首先，该函数会根据需要丢弃无用的开头空格字符，直到寻找到第一个非空格的字符为止。当我们寻找到的第一个非空字符为正或者负号时，则将该符号与之后面尽可能多的连续数字组合起来，作为该整数的正负号；假如第一个非空字符是数字，则直接将其与之后连续的数字字符组合起来，形成整数。该字符串除了有效的整数部分之后也可能会存在多余的字符，这些字符可...

2019-02-11 15:20:26 154

原创 LeetCode 7.整数反转

给出一个 32 位的有符号整数，你需要将这个整数中每位上的数字进行反转。示例 1:输入: 123输出: 321 示例 2:输入: -123输出: -321示例 3:输入: 120输出: 21注意:假设我们的环境只能存储得下 32 位的有符号整数，则其数值范围为 [−231, 231 − 1]。请根据这个假设，如果反转后整数溢出那么就返回 0。...

2019-02-01 10:11:03 169

原创 LeetCode 6.Z字形变换

将一个给定字符串根据给定的行数，以从上往下、从左到右进行 Z 字形排列。比如输入字符串为 "LEETCODEISHIRING" 行数为 3 时，排列如下：L C I RE T O E S I I GE D H N之后，你的输出需要从左往右逐行读取，产生出一个新的字符串，比如："LCIRETOESIIGEDHN"。请你实现这个将字符串进行指定行数变换的...

2019-01-31 16:18:16 139

原创 LeetCode 19.删除链表的倒数第N个节点

给定一个链表，删除链表的倒数第 n 个节点，并且返回链表的头结点。示例：给定一个链表: 1->2->3->4->5, 和 n = 2.当删除了倒数第二个节点后，链表变为 1->2->3->5.说明：给定的 n 保证是有效的。进阶：你能尝试使用一趟扫描实现吗？ # Definition for singly-link...

2019-01-30 11:08:43 119

原创 LeetCode 720.词典中最长的单词

给出一个字符串数组words组成的一本英语词典。从中找出最长的一个单词，该单词是由words词典中其他单词逐步添加一个字母组成。若其中有多个可行的答案，则返回答案中字典序最小的单词。若无答案，则返回空字符串。示例 1:输入: words = ["w","wo","wor","worl", "world"]输出: "world"解释: 单词"world&quo

2019-01-30 10:21:27 139

原创 LeetCode 724.寻找数组的中心索引

给定一个整数类型的数组 nums，请编写一个能够返回数组“中心索引”的方法。我们是这样定义数组中心索引的：数组中心索引的左侧所有元素相加的和等于右侧所有元素相加的和。如果数组不存在中心索引，那么我们应该返回 -1。如果数组有多个中心索引，那么我们应该返回最靠近左边的那一个。示例 1:输入: nums = [1, 7, 3, 6, 5, 6]输出: 3解释: 索引3 (nu...

2019-01-30 10:21:22 136

原创 LeetCode 792.匹配字符列的单词书

给定字符串 S 和单词字典 words, 求 words[i] 中是 S 的子序列的单词个数。示例:输入: S = "abcde"words = ["a", "bb", "acd", "ace"]输出: 3解释: 有三个是 S 的子序列的单词: "a", "acd", "ace"。注意:所有在words和 S 里的单词都只由

2019-01-30 10:21:17 455

空空如也

空空如也