John159151-CSDN博客

原创 #Paper Reading# Apple Intelligence Foundation Language Models

论文大体内容本文介绍了Apple AFM团队的2个基础大模型，分别可在服务端和客户端上运行。这两个大模型是Apple的基础模型，文中描述了从训练到评估模型的各个模块。Motivation这是Apple的基础大模型。Contribution①技术落地的完整性，本文详细描述了训练AFM的各个模块和步骤。②提出了从基础模型扩展到具体任务的整体框架，用于Apple后续各个应用的落地。③强调负责任的AI实践，包括整个流程的Principles，以及注重用户的隐私。

2025-07-14 20:53:30 718

原创 #Paper Reading# DeepSeek-R1

本文提出DeepSeek-R1模型，主要是以DeepSeek-V3[4]基座模型的基础上进行优化，提升其推理能力。本文首先提出了DeepSeek-R1-Zero模型，探索仅用RL去提升推理能力，并进而提出DeepSeek-R1，拿到很好的效果。

2025-05-03 21:42:55 1001

原创 #Paper Reading# DeepSeek Math

本文基于公开的数据集Common Crawl，采用了一种方法抽取出高质量的120B数学数据集，并基于这个数据集训练了一个数学推理模型DeepSeek Math。该模型借助本文提出的GRPO（Group Relative Policy Optimization）方法，增强了其数学推理能力。最终在数学推理上取得了对标GPT-4的效果。

2025-05-03 08:43:03 628

原创 #Paper Reading# DeepSeek Math-Shepherd

本文提出了一种面向过程的数学奖励模型Math-Shepherd。它通过自动给解题的每个步骤分配分数，来解决人工标注数据的依赖。从而使得模型不使用人工标注数据也能达到很好的效果。

2025-04-29 07:51:07 701

原创 #Paper Reading# DeepSeek-V3

本文发布了DeepSeek-V3模型，框架遵循了V2模型[3]，包括MLA和MoE。除此之外，本文融合了MTP（Multi-Token Prediction）的优化点，让模型训练更稠密。经过14.8T的token训练，得到一个671B的模型，共花费557.6万美元，取得了开源模型SOTA的效果，并与闭源模型GPT-4o效果相当。

2025-04-21 20:52:44 510

原创 #Paper Reading# DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model

本文发布了DeepSeek-V2模型，使用了8.1T tokens去训练，属于236B的MoE模型，激活参数量是21B，特别经济高效。其主要创新点是MLA（Multi-head Latent Attention），相比DeepSeek 67B模型，节省了42.5%的训练花销，减少93.3%的KV cache。

2025-04-14 02:13:25 743

原创 #Paper Reading# DeepSeekMoE: Towards Ultimate Expert Specialization in MoE Language Models

本文将DeepSeek LLM从Dense模型改为MoE模型，这也是follow了GPT的发展之路。主要工作是探索MoE的结构，包括增加专家的数量以及拆分为共享专家和独享专家。通过这样的操作，虽然模型参数量增大，但是实际infer的时候激活的参数量并不大，从而达到效果提升且成本降低的成效。

2025-04-13 23:13:10 514

原创 #Paper Reading# DeepSeek LLM: Scaling Open-Source Language Models with Longtermism

本文主要对scaling laws进行了精细化的研究，给出了一个新的公式，并发布了DeepSeek自己的LLM模型（对标LLaMa2），其中7B和67B的模型对标LLaMa2的7B和70B，并拿到了超过LLaMa2的效果。

2025-04-05 16:11:43 907

原创 #Paper Reading# Training language models to follow instructions with human feedback

论文大体内容本文主要提出了GPT-3.5（InstructGPT）模型，通过使用人类反馈的数据集进行监督学习（RLHF，即reinforcementlearning from human feedback），对GPT模型进行Fine-tune，来达到预期效果。

2023-02-21 14:21:34 3051

原创 #Paper Reading# Language Models are Few-Shot Learner

论文大体内容本文主要提出了GPT-3（Generative Pre-Training）模型，通过大模型pre-train进行In-context Learning，并在Zero-shot Learning、One-shot Learning和Few-shot Learning上进行实验，在NLU任务上有不错的表现，但也就只有较少的task上能比得上Fine-tune的SOTA。

2023-02-20 17:24:05 682

原创 #Paper Reading# Language Models are Unsupervised Multitask Learners

论文大体内容：本文主要提出了GPT-2（Generative Pre-Training）模型，通过大模型pre-train进行Unsupervise Learning，并使用Zero-shot Learning的方式在NLU系列任务中取得收益。Motivation创建通用的大模型，是GPT系列文章的最大目标。而对于未涉猎过的领域（Zero-shot learning），通用大模型的效果会是怎么样的呢？Contribution①训练更通用的pre-train模型；②在zero-shot lea

2023-02-18 12:20:51 564

原创 #Paper Reading# Improving Language Understanding by Generative Pre-Training

论文大体内容：本文主要提出了GPT（Generative Pre-Training）模型，通过大模型pre-train + 子任务fine-tune的方式，在NLU系列任务中取得收益。Motivation相对Word2Vec通读全文的方式，本文的GPT模型另辟蹊径，采用通过上文预测下文的方式，更符合人的方式。Contribution①使用半监督学习的方法（大模型pre-train + 子任务fine-tune）进行NLU任务；②在12个task中的9个，取得state-of-art的成绩；

2023-02-16 15:20:30 644

原创 #Paper Reading# Pre-trained Language Model based Ranking in Baidu Search

论文大体内容：本文主要提出了一个Pre-trained的模型，通过引入类似BERT的预训练模型到百度搜索引擎的Ranking模块，来提升Ranking的效果。

2022-08-16 15:35:22 748

原创 #Paper Reading# Stochastic Optimization of Sorting Networks via Continuous Relaxations

论文大体内容：本文主要提出了NeuralSort模型，通过引入松弛，对置换矩阵变换为单峰行随机矩阵来解决sorting问题，使之前不能end2end训练（不可微分）的模型也能进行梯度下降优化。Motivation：Sorting问题不可微分，引入松弛来克服这个问题。Contribution：①提出NeuralSort模型，克服不可end2end训练问题；②应用NeuralSort模型到排列问题中（采用Plackett-Luce (PL) 分布）；③该模型在3个任务中取得收益；.......

2022-06-10 15:20:41 1059

原创 #Paper Reading# Self-supervised Learning for Large-scale Item Recommendations

本文主要提出了SSL（Self-supervised Learning）框架，采用对比学习（Contrastive Learning）的方式用于推荐中召回模型的训练，使模型取得更好的效果。

2021-12-23 15:53:18 2815

原创 #Paper Reading# Search-based User Interest Modeling with Lifelong Sequential Behavior Data for CTR

论文题目: Search-based User Interest Modeling with Lifelong Sequential Behavior Data for Click-Through Rate Prediction论文地址: https://dl.acm.org/doi/10.1145/3340531.3412744论文发表于: CIKM 2020论文大体内容：本文主要提出了SIM（Search-based Interest Model）模型，用于支持超长用户行为序列建模，从而使得模

2021-09-04 17:38:32 428

原创 #Paper Reading# Learning Graph Meta Embeddings for Cold-Start Ads in Click-Through Rate Prediction

论文题目: Learning Graph Meta Embeddings for Cold-Start Ads in Click-Through Rate Prediction论文地址: https://arxiv.org/abs/2105.08909论文发表于: SIGIR 2021（CCF A类会议）论文所属单位: Alibaba论文大体内容：本文主要提出了GME（Graph Meta Embedding）模型来解决item冷启动问题；Motivation：现有模型冷启动问题解决的不够

2021-08-24 15:22:27 585

原创 #Paper Reading# Learning to Warm Up Cold Item Emb for Cold-start Reco with Meta Scaling and Shifting

论文题目: Learning to Warm Up Cold Item Embeddings for Cold-start Recommendation with Meta Scaling and Shifting Networks论文地址: https://arxiv.org/abs/2105.04790论文发表于: SIGIR 2021（CCF A类会议）论文所属单位: 中科院计算所论文大体内容：本文主要提出了MWUF（Meta Warm Up Framework）框架，用于解决冷启动id

2021-08-04 16:23:21 544

原创 #Paper Reading# Warm Up Cold-start Advertisements: Improving CTR Predictions via L2L ID Embeddings

论文题目: Warm Up Cold-start Advertisements: Improving CTR Predictions via Learning to Learn ID Embeddings论文地址: https://dl.acm.org/doi/abs/10.1145/3331184.3331268论文发表于: SIGIR 2019（CCF A类会议）论文所属单位: 中科院计算所论文大体内容：本文主要提出了Meta-embedding的方法，用于给新的item生成更好的初始化em

2021-08-02 20:55:59 486

原创 #Paper Reading# Res-embedding for Deep Learning Based Click-Through Rate Prediction Modeling

论文题目: Res-embedding for Deep Learning Based Click-Through Rate Prediction Modeling论文地址: https://dl.acm.org/doi/abs/10.1145/3326937.3341252论文发表于: KDD 2019（CCF A类会议）论文所属单位: Alibaba论文大体内容：本文主要提出了Res-embedding的方法，用于优化深度学习模型泛化能力不够强的问题；Motivation：常见的emb

2021-04-22 09:12:07 365 2

原创 #Paper Reading# Learning Tree-based Deep Model for Recommender Systems

论文题目: Learning Tree-based Deep Model for Recommender Systems论文地址: https://dl.acm.org/doi/abs/10.1145/3219819.3219826论文发表于: KDD 2018（CCF A类会议）论文所属单位: Alibaba论文大体内容：本文主要提出了TDM（Tree-based Deep Model）方法，用于优化推荐系统中触发的问题；Motivation：常见的模型触发方法是Tower，然后使用AN

2021-04-15 09:14:34 274

原创 #Paper Reading# What You Look Matters? Offline Evaluation of AC for Cold-start Problem

论文题目: What You Look Matters? Offline Evaluation of Advertising Creatives for Cold-start Problem论文地址: https://dl.acm.org/doi/abs/10.1145/3357384.3357813论文发表于: CIKM 2019（CCF B类会议）论文所属单位: 字节跳动论文大体内容：本文主要提出了PEAC（Pre Evaluation of Ad Creative Model）模型，使用内

2021-04-13 16:48:26 550

原创 #Paper Reading# MeLU: Meta-Learned User Preference Estimator for Cold-Start Recommendation

论文题目: MeLU: Meta-Learned User Preference Estimator for Cold-Start Recommendation论文地址: https://dl.acm.org/doi/abs/10.1145/3292500.3330859论文发表于: KDD 2019（CCF A类会议）论文所属单位: NCSOFT论文大体内容：本文主要提出了MeLU模型，使用meta-learning的方法（应用MAML框架[1]）去解决推荐系统上的冷启动问题。Motiva

2021-04-12 15:38:42 493

原创 #Paper Reading# Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks

论文题目: Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks论文地址: http://proceedings.mlr.press/v70/finn17a论文发表于: ICML 2017（CCF A类会议）论文所属单位: OpenAI论文大体内容：本文主要提出了与模型无关的Meta Learning框架，能够用于有效解决few-shot learning下的分类、回归、强化学习等问题。Motivation：传统

2021-04-08 21:17:33 510

原创 #Paper Reading# Efficient Heterogeneous Collaborative Filtering without NS for Recommendation

论文题目: Efficient Heterogeneous Collaborative Filtering without Negative Sampling for Recommendation论文地址: https://ojs.aaai.org/index.php/AAAI/article/view/5329论文发表于: AAAI 2020（CCF A类会议）论文所属单位: 清华大学论文大体内容：本文主要提出了EHCF（Efficient Heterogeneous Collaborativ

2021-04-07 15:06:19 293

原创 #Paper Reading# MOBIUS: Towards the Next Generation of Query-Ad Matching in Baidu’s Sponsored Search

论文题目: MOBIUS: Towards the Next Generation of Query-Ad Matching in Baidu’s Sponsored Search论文地址: https://dl.acm.org/doi/abs/10.1145/3292500.3330651论文发表于: KDD 2019（CCF A类会议）论文所属单位: Baidu论文大体内容：本文主要提出了一个基于Active Learning的数据增强算法——MOBIUS（莫比乌斯），用于解决百度凤巢中广告

2021-02-02 15:32:19 539

原创 #Paper Reading# Representation Learning-Assisted Click-Through Rate Prediction

论文题目: Representation Learning-Assisted Click-Through Rate Prediction论文地址: https://arxiv.org/abs/1906.04365论文发表于: arXiv 2019论文所属单位: Alibaba论文大体内容：本文主要提出了一个联合学习的框架DeepMCP，对于传统的CTR预测任务，在使用User和Item的特征基础上，还加入了UI之间的关系，II之间的关系进行联合学习，从而得出更好的效果。Motivation：

2021-01-04 17:54:43 302 1

原创关于“共识”算法以及比特币

最近看了一些关于“共识”算法的文章，从拜占庭问题、Paxos算法到比特币，觉得挺有意思的，下面简单总结下。1. 拜占庭问题描述如下：一组拜占庭将军分别各率领一支军队共同围困一座城市，各位将军必须通过投票来达成一致策略，即所有军队采取相同的行动。但因为各位将军距离较远，他们只能通过信使互相联系。将军们要如何达成共识？如果将军们存在叛徒，要怎么做？-->解决方法有两两通信、数字签名、PBFT等，详见[1]。2. Paxos算法曾存在名为paxos的希腊城邦（虚构），这个城邦选择议会投票的方式

2020-10-08 22:57:28 791

原创 #Paper Reading# On Sampled Metrics for Item Recommendation

论文题目: On Sampled Metrics for Item Recommendation论文地址: https://dl.acm.org/doi/abs/10.1145/3394486.3403226论文发表于: KDD 2020 best paper论文大体内容：本文主要论述了在推荐领域中，使用采样testset进行evaluate来比较各个模型，有可能会得出相反的结论。Motivation：数据量太大，所以工业界很多情况下都会选择采样。但是采样后计算的指标，是否与不采样的一致呢，

2020-09-19 16:07:03 661

原创 #Book Reading# 事实

书名: 事实链接: https://item.jd.com/12585998.html这本书告诉我们先验知识、对世界的固有印象，很容易导致认知的偏差，从而导致决策的失败。所以我们应该用数据思考，根据客观事实，给出判断，而不是想当然。本书开篇给出了13个关于对世界认知的问题（3选1），大部分人的回答正确率达不到 1/3 ，比随机乱猜还差。因为我们固有认识里，目前世界面临着很多的问题，未来世界会变得更差（受影视作品、新闻报道等影响）。而殊不知，世界正在逐渐变好。本书主要描述了10个情绪化本能，需要

2020-09-14 17:23:52 240

原创 #Book Reading# 算法交易员——会赚钱的人工智能

书名: 算法交易员——会赚钱的人工智能链接: https://item.jd.com/12696862.html这本书主要写了宽客（量化交易员）的发展历史，以及作者作为一名宽客，从入行到目睹这一行业的种种瞬间、变化、发展的感悟。其实这本书更多的还是类似闲聊或者从讲作者自身目睹的故事来写的，并没有我所期待的“干货”，但是看了之后能对一个想了解这一行业的小白有所帮助。我最早了解量化交易这一领域，是本科的时候玩ACM比赛的时候，了解到某位ACM大牛关于Jane Street这家金融公司的介绍[1]。当时

2020-09-14 01:21:33 602

tdm-gcc-64位

fastdfs v3.11

Sudoku数独

TDM-GCC编译器

vim和screen的配置

空空如也