自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(37)
  • 收藏
  • 关注

原创 梁宁产品思维30讲:模块一同理心

听后感悟与记录。如有侵权请告知。共分五个模块来记录:同理心、机会判断、系统能力、用户体验、创新模式引言01讲——产品是每个人的底层能力产品能力是人生的一个底层能力,拥有产品能力,能让你有一种脚踩在地上的自信和踏实感,因为我们大家都是从一无所有的状态走来,因为没有认知框架,所以每天会收到各种各样的信息冲击着你的情绪却不知该如何处置和识别。培养产品能力会给你生存的底气会给你自信,产...

2019-12-04 10:18:18 666

原创 刷题三:25 Reverse Nodes in k-Group

给定链表,一次反转链表k个节点并返回其修改后的列表。k是正整数,并且小于或等于链表的长度。 如果节点数不是k的倍数,那么最后的剩余节点应该保持不变。做法:用一个类似k窗口大小,一组一组处理用l和r来标识每一组的范围(k大小): 每一更新l要更新到r的位置上去,r再不断next k个节点用pre 和cur来进行改变节点指向:每次更新pre移动到cur,cur移到下一个位置用j...

2019-07-08 07:23:50 276

原创 刷题二:24 Swap nodes in pairs 链表中两两节点进行反转

这里要分奇数偶数,因为12 34 5反转后为21 43 5注意:note中写明不能修改链表中的值,左面这种方式是直接改链表中的值不正确 传入头指针,毫无疑问要进行循环;需要三个指针,指向的相邻两个元素a,b,相邻两个元素前面的那个元素pre法一:这个对于self理解有难度,我还是不太理解def swapPairs(self, head): pre, pre...

2019-07-07 10:19:56 254

原创 刷题一:206 reverse linked list翻转单链表

思考逻辑很简单,主要考察写代码的能力最关键的一点在于要将当前的next指针,指到前驱节点上。所以需要两个指针,一个指针记录当前的节点,还要有一个指针记录前面的节点注意python用“,”实现值的交换,理解为同时进行的,而不是分为三步进行def reverseList(self,head): cur, prev = head, None while cur: ...

2019-07-06 16:23:29 406

原创 莫烦老师,Prioritized Experience Replay代码学习笔记

详情见莫烦老师:https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/4-6-prioritized-replay/莫烦老师的源代码:https://github.com/MorvanZhou/Reinforcement-learning-with-tensorflow/tree/maste...

2019-07-06 16:16:19 2968 1

原创 莫烦老师,Policy Gradient代码学习笔记

详情请见莫烦老师主页:https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/5-1-A-PG/论文见:https://papers.nips.cc/paper/1713-policy-gradient-methods-for-reinforcement-learning-with-funct...

2019-07-06 16:09:36 3715 4

原创 论文阅读16:Reinforcement Learning based Recommender System using Biclustering Technique

Reinforcement Learning based Recommender System using Biclustering Technique原文链接: https://arxiv.org/pdf/1801.05532.pdf“强化学习推荐,借助双聚类biclustering减少状态和动作空间优化效率和效果”Abstract:推荐系统致力于在海量的信息中为用户...

2019-04-02 22:53:52 841

原创 论文阅读15:Massively Parallel Methods for Deep Reinforcement Learning

论文阅读笔记之Massively Parallel Methods for Deep Reinforcement Learning本文创新点:提出了一个对于深度强化学习的大规模分布式架构Gorila(General Reinforcement learning Architecture)架构组成:用于产生behavior的并行actor组;从经验池学习的并行learner组;...

2019-03-11 14:28:39 776

原创 程世东老师TensorFlow实战——个性化推荐,代码学习笔记之③推荐过程

个性化推荐第三部分:推荐过程(完结撒花)代码来自于知乎:https://zhuanlan.zhihu.com/p/32078473/代码地址https://github.com/chengstone/movie_recommender/blob/master/movie_recommender.ipynb------------------------------------------...

2018-12-03 17:07:03 2562 20

原创 程世东老师TensorFlow实战——个性化推荐,代码学习笔记之②模型训练与测试

个性化推荐第二部分:模型训练代码来自于知乎:https://zhuanlan.zhihu.com/p/32078473/代码地址https://github.com/chengstone/movie_recommender/blob/master/movie_recommender.ipynb前面数据预处理已经将训练好的数据保存在proprecess.p文件中,这里直接引用(从本地读取...

2018-12-03 08:34:13 2419 9

原创 tf.concat解析

tf.concat( values, axis, name='concat')其中:values: A list of Tensor objects or a single Tensor.单一的tensor对象或者是一个list的tensor对象axis:连接的维度。注意:这里0表示的连接维度是第一个括号所在的维度,1表示第二个括号所在维度,2表示第三个括号所在...

2018-11-30 15:17:31 854

原创 程世东老师TensorFlow实战——个性化推荐,代码学习笔记之①数据导入&数据预处理(下)

这篇主要是进行代码中的一些数值可视化,帮助理解代码来自于知乎:https://zhuanlan.zhihu.com/p/32078473/代码地址https://github.com/chengstone/movie_recommender/blob/master/movie_recommender.ipynb数据预处理过程中的预览:(可以跳过看图片结果)1.1、Users的初始读...

2018-11-26 21:37:28 1636

原创 程世东老师TensorFlow实战——个性化推荐,代码学习笔记之①数据导入&数据预处理(上)

代码来自于知乎:https://zhuanlan.zhihu.com/p/32078473/代码地址https://github.com/chengstone/movie_recommender/blob/master/movie_recommender.ipynb下一篇有一些数据的可视化,帮助理解#运行下面代码把数据下载下来import pandas as pd from ...

2018-11-25 21:03:15 3271 1

原创 Navicat for MySql可视化导出CSV文件

Navicat for MySql可视化导出CSV文件版本号:Navicate 12用的movielens数据集中rating举个例子查询语句select userId,avg(rating)from ratingsgroup by userIdORDER BY userId结果进行导出start即可。导出后效果,我用notepad+...

2018-11-22 17:01:06 3240

原创 Linux下mysql进行group by ,order by查询报错

select userId,count(movieId)from ratingsgroup by userIdorder by userId报错:[Err] 1055 - Expression #1 of ORDER BY clause is not in GROUP BY clause and contains nonaggregated column 'information_sc...

2018-11-16 23:52:42 937

原创 MovieLens推荐系统数据集官方文档+解释

参见和下载地址:https://grouplens.org/datasets/movielens/MovieLens       GroupLens Research已从MovieLens网站(http://movielens.org)收集并提供评级数据集。根据集合的大小,在不同的时间段收集数据集。在使用这些数据集之前,请查看其README文件以获取使用许可证和其他详细信息。帮助我们...

2018-11-12 23:43:13 13332 5

原创 Navicat for MySql可视化导入CSV文件

版本号:Navicate 121、创建一个数据库,右键单击表,导入向导import Wizard。2、选择导入的数据文件格式,next->3、选择要导入的.csv文件,注意编码格式与文件编码格式一样否则会出现乱码,然后进行下一步4、选择需要的分隔符,我用的Linux,所以record delimiter这个记录分隔符为LF,来表示下一行5、根据你的csv文件内...

2018-11-12 11:08:09 4276

原创 Linux下安装python的mysql包——MySQLdb 和 PyMySQL

这里涉及python2,python3,其实是一些不同的包,都可以实现python与mysql的连接,只是内部使用有所不同python2MySQLdb 是用于Python2.x链接Mysql数据库的接口(Python 连接 MySQL 最流行的一个驱动)· 安装mysql模块sudo apt-get install python-mysql· 进入python2,引入模块来检...

2018-11-07 22:29:12 1766

原创 莫烦老师遗传算法代码笔记(+布尔型索引)

在学习莫烦老师的遗传算法---找曲线最高点的例子的时候,读代码的时候发现有个布尔型索引。参见:https://morvanzhou.github.io/tutorials/machine-learning/evolutionary-algorithm/2-01-genetic-algorithm/全部代码注释笔记如下:"""Visualize Genetic Algorithm t...

2018-09-06 17:49:04 5716 7

原创 论文阅读14+总结:Reinforcement learning approach towards effective content recommendation in MOOC environme

参考论文:Reinforcement learning approach towards effective content recommendation in MOOC environments #论文笔记:Reinforcement learning approach towards effective content recommendation in MOOC environmen...

2018-09-03 21:04:31 364

原创 论文阅读14:Reinforcement learning approach towards effective content recommendation in MOOC environments

参考论文:Reinforcement learning approach towards effective content recommendation in MOOC environments#论文笔记:Reinforcement learning approach towards effective content recommendation in MOOC environmen...

2018-08-09 21:57:33 593

原创 论文阅读13:ENHANCING COLLABORATIVE FILTERING MUSIC RECOMMENDATION BY BALANCING EXPLORATION AND EXPLOITAT

参考论文:ENHANCING COLLABORATIVE FILTERING MUSIC RECOMMENDATION BY BALANCING EXPLORATION AND EXPLOITATION知乎同文链接:https://zhuanlan.zhihu.com/p/41068720通过平衡探索和开发,增强协同过滤音乐推荐ABSTRACT协同过滤技术在音乐推荐应用中取得了巨大...

2018-08-09 21:55:37 396

原创 论文笔记12:Building Adaptive Tutoring Model using Artificial Neural Networks and Reinforcement Learning

论文笔记12:《Building Adaptive Tutoring Model using Artificial Neural Networks and Reinforcement Learning》参考文献:Building Adaptive Tutoring Model Using Artificial ..._百度学术图片出不来,请参考我知乎同文连接:https://zhuanla...

2018-08-09 21:53:46 317

原创 论文笔记11:Development of a Music Recommendation System for Motivating Exercise

参考论文:Development of a Music Recommendation System for Motivating Exercise图片出不来,请参考我同文知乎连接:https://zhuanlan.zhihu.com/p/40912861Abstract虽然定期体育锻炼对健康的益处是很明显的,但许多人锻炼的程度远低于既定的指导方针。音乐已经被证明有一种激励作用,可以鼓励...

2018-08-09 21:51:43 436

原创 论文笔记10:ITSEGO: An Ontology for Game-based Intelligent Tutoring Systems

参考论文:ITSEGO: An Ontology for Game-based Intelligent Tutoring SystemsAbstract这项工作提出了一个方法,发展学生解决问题的能力和数字能力,实现从幼儿园到小学的过渡。通过一种基于本体的方法,该方法将一个智能的辅导系统(ITS)集成到一个结构化的基于游戏的教育环境中,方便了教师和儿童。ITSEGO,提供了一个模型(通常适用...

2018-08-09 21:50:15 261

原创 论文阅读9:在自适应辅导系统中保持和测量ZPD

参考论文:Toward Measuring and Maintaining the Zone of Proximal Development in Adaptive Instructional Systems图片出不来,请参见我的知乎连接:https://zhuanlan.zhihu.com/p/40399164Abstract智能辅导系统(ITSs)将内容和活动调整为既有效又高效的教...

2018-08-09 21:47:43 1691

原创 论文笔记8:通过形式概念分析建立教学模式

Building Pedagogical Models by Formal Concept Analysis通过形式概念分析建立教学模式未完。。。。。参考文献:Building Pedagogical Models by Formal Concept Analysis形式概念分析在软件工程中的应用综述----臧国轻,李瑞光,郑 珂ps:图片显示不了,请参见我的知乎连接htt...

2018-08-09 21:44:16 667

原创 论文笔记7:Prioritized Experience Replay

参考资料:https://www.baidu.com/link?url=Ea9z7rbX4jMNcr01YuTgqiRn2AVofeznnVuNTUdMmZvjqZ_odCdrm13FiahPkyur&wd=&eqid=9dd06a3a00005cfa000000035b2c5e1dPrioritized Experience Replay (DQN) (Tensorflo...

2018-06-29 15:57:53 10747 2

转载 深度增强学习(DRL)漫谈 - 从DQN到AlphaGo

本文转载自:https://blog.csdn.net/jinzhuojun/article/details/52752561深度增强学习(Deep reinforcement learning, DRL)是DeepMind(后被谷歌收购)近几近来重点研究且发扬光大的机器学习算法框架。两篇Nature上的奠基性论文(DQN和AlphaGo)使得DRL这一深度学习(Deep learning, DL...

2018-06-20 10:15:18 544

原创 论文笔记6:Increasing the Action Gap: New Operators for Reinforcement Learning

参考文献:New Operators for Reinforcement Learning同名知乎:uuummmmiiii这篇文章实在是式子多,整个看懵,网上目前没啥人看过这篇,论文有两部分,我挣扎了一下看了第一部分,所以第二部分具体作者创新了什么,做了什么相关推导我也不知道,哭泣。如有错误还请指出,本人小白,希望帮助更多的人,一同进步。论文分为两部分:前部分:作者介绍新提出...

2018-06-14 21:58:56 424

原创 论文笔记5:How to Discount Deep Reinforcement Learning:Towards New Dynamic Strategies

参考资料:How to Discount Deep Reinforcement Learning: ...为帮助跟我一样的小白,如果有大神看到错误,还请您指出,谢谢~知乎同名:uuummmmiiii创新点:相比于原始DQN不固定折扣因子(discount factor,γ),学习率(learning rate,α)改进:变化discount factor 和 learning ra...

2018-06-04 21:26:44 747

原创 论文笔记4:Language Understanding for Text-based Games using Deep Reinforcement Learning

参考资料:Language Understanding for Text-based Games Using ...同名知乎:uuummmmiiii由于本文进行了LSTM与DQN结合,在结构上其实并没有很大的新结构创新,粗略看了一下,了解了一下大致思想。为帮助跟我一样的小白,如果有大神看到错误,还请您指出,谢谢~创新点:将DQN与LSTM结合去解决文字游戏(test-based g...

2018-06-03 17:08:44 490

原创 论文笔记3:Dynamic Frame skip Deep Q Network(DFDQN)

参考文献:Dynamic Frame skip Deep Q Network我的知乎:uuummmmiiii(与CSDN同名)如有错误,请指明,我将立即改正,谢谢。创新点:DQN基础上增加了选择动作重复次数的输出(构建动态跳帧模型)改进:将DQN的全连接层变成了1024个单元,并且增加一层全连接层(36个单元)改进原因:因为游戏玩法不同,有的需要进行快速决策,有的游戏需要进行一...

2018-05-27 17:04:22 939

原创 论文笔记2:Deep Attention Recurrent Q-Network

参考文献:[1512.01693] Deep Attention Recurrent Q-Network (本篇DARQN)[1507.06527v3] Deep Recurrent Q-Learning for Partially Observable MDPs(DRQN,可参见我上一篇笔记)目前网上我搜到的论文笔记参考:论文笔记之:Deep Attention Recurrent Q-...

2018-05-27 09:41:10 1906

原创 论文笔记1:Deep Recurrent Q-Learning for Partially Observable MDPs

参考资料:鼻祖论文:Playing Atari with Deep Reinforcement LearningHuman-level control through deep reinforcement learning.论文笔记之:Deep Recurrent Q-Learning for Partially Observable MDPs最近老师让看一写DQN...

2018-05-27 09:40:00 2701

原创 莫烦老师,DQN代码学习笔记(图片版)

详情请见莫烦老师DQN主页:DQN 算法更新 (Tensorflow) - 强化学习 Reinforcement Learning | 莫烦Python莫烦老师代码(没有我繁琐注释代码直通车):MorvanZhou/Reinforcement-learning-with-tensorflow上一篇博客有代码版,可粘贴参考文献:Playing Atari with Deep Reinfo...

2018-05-27 09:38:56 6405 8

原创 莫烦老师,DQN代码学习笔记

详情请见莫烦老师DQN主页:DQN 算法更新 (Tensorflow) - 强化学习 Reinforcement Learning | 莫烦Python莫烦老师代码(没有我繁琐注释代码直通车):MorvanZhou/Reinforcement-learning-with-tensorflow参考文献:Playing Atari with Deep Reinforcement Learninghtt...

2018-05-27 09:36:13 13712 13

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除