长相忆兮长相忆-CSDN博客

原创【Mac】MacOS系统下常用的开发环境配置2025版

【Mac】2025MacOS系统下常用的开发环境配置。

2025-03-03 14:01:57 475

DQN算法通常包含两个网络：一个是评估网络training_network，另一个是目标网络target_network。这两个网络的结构和初始权重是相同的，但它们的权重是不同步更新的。使用两个网络的原因是为了稳定学习过程。在DQN算法中，目标网络的权重是定期从评估网络网络复制的，但更新的频率远低于评估网络网络。这种做法有助于减少目标Q值（即预期的回报）与当前Q值（即实际的回报）之间的相关性，从而减少了学习过程中的波动性。training_network来计算。target_network计算。

2024-05-15 20:59:17 607

原创【机器学习】Reinforcement Learning-强化学习基本概念

评估的价值，它代表了智能体选择这个动作后，一直到最终状态的；评估的价值，它代表了智能体在这个状态下，一直到最终状态的的。Q值和V值的概念是一致的，都是衡量在马可洛夫树上某一个节点的价值。只不过V值衡量的是状态节点的价值，而Q值衡量的是动作节点的价值。

2024-05-11 23:24:36 597

原创【推荐算法】MMoE模型：Modeling Task Relationships in Multi-task Learning with Multi-gate Mixture-of-Experts

MMoE是谷歌在2018年发表在KDD上的一篇基于多任务学习的经典论文，其使用场景是对不相关任务的多任务学习。在推荐系统中，这些不相关的任务可以示例为：视频流推荐中的CTR、时长、点赞、分享、收藏、评论等相关性不强的多个任务。

2022-12-22 20:49:34 4618

原创【机器学习】Reinforcement Learning-强化学习学习笔记

强化学习（Reinforcement Learning, RL），又称增强学习，是机器学习的范式和方法论之一，用于描述和解决智能体（agent）在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。...

2022-01-28 17:40:19 4187

原创【Mac】MacOS系统下常用的开发环境配置

基于Mac系统的常用开发环境配置系统版本：11.3.1 (20E241)

2021-07-20 21:17:48 4130 1

原创【推荐算法】DSSM双塔模型：Deep Structured Semantic Models for Web Search using Clickthrough Data

DSSM，全称Deep Structured Semantic Model，就是我们通常所说的双塔模型，是微软公司提出的一种基于深度网络的语义模型，其核心思想是将query和doc映射到到共同维度的语义空间中，通过最大化query和doc语义向量之间的余弦相似度，从而训练得到隐含语义模型，达到检索的目的。DSSM有很广泛的应用，比如：搜索引擎检索，广告相关性，问答系统，机器翻译等。

2021-06-17 11:27:45 6392 1

原创【推荐算法】DeepFM模型：A Factorization-Machine based Neural Network for CTR Prediction

DeepFM模型是由哈尔滨工业大学和华为实验室联合提出的，将FM模型结构与Wide&Deep模型进行了融合。DeepFM可以同时提取低阶组合特征与高阶组合特征。其中，FM模型负责提取一阶特征以及两两交叉特征；DNN模型负责提取高阶特征。相比于谷歌最新的Wide&Deep模型，DeepFM模型的Deep component和FM component从Embedding层共享数据输入，同时不需要专门的特征工程，在推荐系统中取得了不错的推荐效果。

2021-06-03 14:51:03 3902 3

原创【Algorithm】经典的最长序列算法综述

1、最长公共子序列LCS（longest common sequence）2、最长递增子序列LIS（longest increasing subsequence）

2021-06-01 11:17:50 907 1

原创【推荐算法】FM模型：Factorization Machines

FM算法是一种基于矩阵分解的机器学习算法，是为了解决大规模稀疏数据中的特征组合问题。在传统的线性模型如LR中，每个特征都是独立的，如果需要考虑特征与特征之间的交互作用，可能需要人工对特征进行交叉组合；非线性SVM可以对特征进行kernel映射，但是在特征高度稀疏的情况下，并不能很好地进行学习；现在也有很多分解模型Factorization Model如矩阵分解MF、SVD++等，这些模型可以学习到特征之间的交互隐藏关系，但基本上每个模型都只适用于特定的输入和场景。为此，FM出现了。

2021-05-17 11:41:09 5355 3

原创【机器学习】推荐系统、机器学习面试题整理

推荐系统、机器学习常见面试题整理。

2021-05-10 23:18:50 3280

原创【Algorithm】彻底解释三种背包问题

背包问题背包问题是一类经典的动态规划问题，本文先对背包问题的几种常见类型作一个总结，期望可以用一套框架解决背包问题。这里先简单说说动态规划。动态规划与分治法类似，都是把大问题拆分成小问题，通过寻找大问题与小问题的递推关系，解决一个个小问题，最终达到解决原问题的效果。但不同的是，分治法在子问题和子子问题等上被重复计算了很多次，而动态规划则具有记忆性，通过填写表把所有已经解决的子问题答案纪录下来，在新问题里需要用到的子问题可以直接提取，避免了重复计算，从而节约了时间，所以在问题满足最优性原理之后，用

2021-05-10 15:19:51 822

原创【推荐系统】推荐系统中一些常用的技术方法

本文主要总结了一些推荐系统中用来解决实际问题常用的技术方法。1、威尔逊区间平滑威尔逊区间平滑可以用来修正item的点击率CTR。Click-Through-Rate，即点击率，是推荐系统中一项重要的衡量指标。原始的CTR计算公式：CTR = 点击数 / 曝光数。这样的计算方式只考虑了相对值，没有考虑绝对值，即没有考虑曝光的数值大小。因为，在曝光很少的情况下，计算出的CTR并不真实可靠，而样本数越大，CTR的比例才越准确，更能反应真实情况。举个例子，有三个广告：A：点击数5...

2021-04-29 11:31:44 3935

原创【Linux】阿里巴巴图学习框架Euler源码单机安装教程

系统版本：Ubuntu 16.04Euler目前开源的版本是Euler2.0，仅支持Python2，所以在安装的时候，为了避免不必要的坑，将系统的python版本设置成python2.7以上，这里以python2.7.12为例。（pip的版本要与python的版本对应）安装参考：Euler2.0编译安装尝试过从PyPI安装，貌似遇到了一些问题，弃掉从编码编译安装。（直接pip安装的那个是为了单机用户准备的，所以没有编译hdfs的部分）。具体安装流程：1、获取源码git clon...

2020-12-09 10:46:24 763

原创【TensorFlow】TensorFlow实战Google深度学习框架第2版参考代码（12-TensorFlow计算加速）

郑泽宇&梁博文&顾思宇著《TensorFlow实战Google深度学习框架（第2版）》第12章TensorFlow计算加速部分样例代码。

2020-11-18 19:43:31 375

原创【TensorFlow】TensorFlow实战Google深度学习框架第2版参考代码（11-TensorBoard可视化）

郑泽宇&梁博文&顾思宇著《TensorFlow实战Google深度学习框架（第2版）》第11章TensorBoard可视化部分样例代码。

2020-11-18 19:35:01 274

原创【TensorFlow】TensorFlow实战Google深度学习框架第2版参考代码（10-TensorFlow高层封装）

郑泽宇&梁博文&顾思宇著《TensorFlow实战Google深度学习框架（第2版）》第10章TensorFlow高层封装部分样例代码。

2020-11-18 17:59:11 305 2

原创【TensorFlow】TensorFlow实战Google深度学习框架第2版参考代码（09-自然语言处理）

郑泽宇&梁博文&顾思宇著《TensorFlow实战Google深度学习框架（第2版）》第9章自然语言处理部分样例代码。

2020-11-18 17:47:30 365

原创【TensorFlow】TensorFlow实战Google深度学习框架第2版参考代码（08-循环神经网络）

郑泽宇&梁博文&顾思宇著《TensorFlow实战Google深度学习框架（第2版）》第8章循环神经网络部分样例代码。

2020-11-18 17:34:39 231

原创【TensorFlow】TensorFlow实战Google深度学习框架第2版参考代码（07-图像数据处理）

郑泽宇&梁博文&顾思宇著《TensorFlow实战Google深度学习框架（第2版）》第7章图像数据处理部分样例代码。

2020-11-18 15:54:41 245

原创【TensorFlow】TensorFlow实战Google深度学习框架第2版参考代码（06-图像识别与卷积神经网络）

郑泽宇&梁博文&顾思宇著《TensorFlow实战Google深度学习框架（第2版）》第6章图像识别与卷积神经网络部分样例代码。

2020-11-18 15:18:31 402 1

原创【TensorFlow】TensorFlow实战Google深度学习框架第2版参考代码（05-MNIST数字识别问题）

郑泽宇&梁博文&顾思宇著《TensorFlow实战Google深度学习框架（第2版）》第5章MNIST数字识别问题部分样例代码。

2020-11-18 11:50:35 175

原创【TensorFlow】TensorFlow实战Google深度学习框架第2版参考代码（04-深层神经网络）

郑泽宇&梁博文&顾思宇著《TensorFlow实战Google深度学习框架（第2版）》第4章深层神经网络部分样例代码。

2020-11-18 11:08:23 293

原创【TensorFlow】TensorFlow实战Google深度学习框架第2版参考代码（03-TensorFlow入门）

郑泽宇&梁博文&顾思宇著《TensorFlow实战Google深度学习框架（第2版）》第3章TensorFlow入门部分样例代码。

2020-11-18 10:48:31 255

原创【TensorFlow】TensorFlow2.0学习笔记（一）

一、TensorFlow是什么？TensorFlow是一个端到端开源机器学习平台。它拥有一个全面而灵活的生态系统，其中包含各种工具、库和社区资源，可助力研究人员推动先进机器学习技术的发展，并使开发者能够轻松地构建和部署由机器学习提供支持的应用。开源深度学习库TensorFlow允许将深度神经网络的计算部署到任意数量的CPU或GPU的服务器、PC 或移动设备上，且只利用一个 TensorFlow API。你可能会问，还有很多其他的深度学习库，如 Torch、Theano、Caffe 和 MxNet，那

2020-09-28 20:34:35 381

VS2010调用Tesseract-OCR需要使用的全部工具

数据结构经典的排序算法

libsvm训练集

空空如也