自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(44)
  • 资源 (3)
  • 问答 (1)
  • 收藏
  • 关注

原创 【万字长文】 游戏的内容生态发展简史

什么是内容生态系统?维基百科中给生态系统的定义是:在一个特定环境内相互作用的所有生物和环境的统称,此环境里非生物与其间的生物之间具交互作用,不断地进行物质的交换和能量的传递,并借由物质流和能量流的连接,形成的一个整体。当下的游戏内容市场之所以可以称之为生态系统,是因为有信息这种物质的交换和传递,并且形成了一个整体,而且只有作为整体来研究才会更好的理解其中复杂的关系。(Zuckerman E[5]中提出的媒体生态系统)

2023-02-13 10:44:29 871

原创 《营销科学决策实践》

当前在腾讯游戏负责内容与UA生态相关的科学度量、决策优化以及产品化的工作。企业的营销活动面临投入无法量化,效果难以度量,决策反事实预估等问题,尤其在缺少个体微观数据的下如何做出科学分析。这次分享我们从技术层面介绍如何通过计算社会学、因果推断、计量经济等一系列技术组合来评价营销活动的宏观效果(Effect of Cause);如何商品化创意并且分析创意营销效果的原因(Cause of Effect)等问题并归纳总结,介绍如何构建营销生态从微观到宏观的科尔曼之舟(Coleman Boat)。

2023-01-23 21:11:38 188

原创 内容 AI:建立统一的跨媒体多模态内容理解内核

转载:https://aijishu.com/a/1060000000089247作者: 孙子荀 zixunsun@tencent.com,腾讯 IEG 专家研究员Jeff Dean 谈 2020 年机器学习趋势:多任务和多模式学习将成为突破口2019 年下半年,CDG 广告、 CSIG 音视频,IEG 内容推荐、PCG 信息流、TEG 数平广告推荐和 AI 平台部...

2020-02-19 23:01:16 1420 1

原创 【内容算法】内容质量之标题党

业务定义首先在我们讨论标题党的时候,我们需要定义清楚,我们说的是1 仅标题带来的主观感受,还是 2 通过标题点击进入文章后的阅读感受。如果是1 :标题的感受。来源于几个indicate 。a .表征的有: 用词用语 ,句法句样式; (可以看文末【标题党特征举例】)b .知识层面的有: 标题是否让人主观先验到,大概率是虚假新闻。如果是2:通过标题后阅读文章...

2020-02-16 00:54:36 1829

转载 腾讯用 AI 自动创作内容,离取代人类还有多远?

https://cloud.tencent.com/developer/news/466197腾讯游戏之名,如雷贯耳。在其盛名的背后,腾讯游戏也有着专门的团队进行游戏内容处理和创作的研究和探索工作。为了解腾讯在相关领域的种种实践及获得的各种经验,InfoQ 采访了腾讯专家研究员 孙子荀老师。另外,孙子荀老师还将会在今年 11 月 21 日举行的AICon 全球人工智能与机器学习技...

2019-11-06 23:00:12 733

原创 信息流内容算法

随着深度学习技术的发展,个性化阅读领域的媒体内容有了更加丰富的处理手段。在过去主要是基于机器学习技术来进行内容分类、主题建模等。现在有了更加丰富的技术手段对于视频图片等富媒体内容进行建模处理。如何应用深度学习技术帮助内容产品提高内容的质量、点击率,如何为新媒体内容运营提供帮助,如何使用算法提高内容处理效率节约人工审核成本,都是现在内容算法能力应用的场景和要解决的问题。业内领先的内容产...

2019-07-20 09:45:22 1083

原创 IntroToDataMining(CMU)

https://xthink.us/2019/03/26/7a8bd1f03e/Zixun SunExpertResearcheratDatamining Center in Interactive Entertainment Group(IEG)Zixun Sun is currently a team leader responsible for dat...

2019-05-04 15:51:55 208

原创 一文看懂虚假新闻检测(附数据集 & 论文推荐)

一文看懂虚假新闻检测(附数据集 & 论文推荐)原创: 孙子荀 PaperWeekly 昨天 作者丨孙子荀单位丨腾讯科技高级研究员研究方向丨多模态内容质量 本人过去几年一直从事内容质量方面的算法工作,近期出于兴趣对假新闻这个问题做了一些调研,简单总结一下提供读者参考。 在某种程度上假新闻的是一个微观领域问题,它和谣言分类,事实判断,标题党检测,垃圾内容...

2019-02-20 15:45:26 6966 1

原创 腾讯内容平台系统的架构实践

  转摘:http://www.sohu.com/a/257876751_355140作者介绍孙子荀(腾讯/SNG内容平台部/平台产品中心/算法平台组和后台一组组长)11 年在百度从事MPI算法方面的工作。12 年加入腾讯,15 年开始负责QQ 公众号平台和内容中心后台,并带领团队从无到有一起搭建了QQ的内容平台。16 年开始投入内容处理能力的算法研究和落地工作。作者 | 孙子...

2018-10-23 19:37:45 2936 2

原创 分布式消息发送集群

手 Q 公众号是从去年底的开始开发,期间封闭开发半年时间,基础能力已经对齐微信,而且在其他领域有新的拓展。目前已经对腾讯系的业务开放,对外小范围开放。等待政府批文之后,将全面开放注册。现在业务规模支撑百万公众号,关系链存储上T 。机器规模春节期间在数百台,有深圳天津两个中心,分散在十几个 IDC 机房。消息规模每天数十亿,支撑了手 Q 一半以上的日活,包括腾讯新闻、QQ 音乐、附近、天气、购物...

2018-08-17 22:30:15 1687 1

原创 数据与内容中台

https://2018.qconshanghai.com/track/404 专题:数据与内容中台近年来,随着云服务思想落地生根结果;微服务架构切实的提高了生产效率;深度学习不断深入内容处理的各个领域促进生产力的发展。 在消息系统,数据仓库,计算框架,存储系统等基础架构层建设逐步提升的基础上,大型互联网公司进一步提出了业务基础设施的需求。在基础架构和上层业务之间急需一个中台系统来承载...

2018-08-17 22:27:15 3967

原创 构建内容分发平台的技术架构与挑战及AI技术的应用实践

http://download.csdn.net/meeting/speech_preview/365 SDCC 2017

2017-06-19 23:42:44 1010

原创 数据挖掘分析在流量调度的应用

携程C4技术分享沙龙大数据分析在宽带调度的应用腾讯 孙子荀 2014http://www.imooc.com/video/10604

2017-01-01 16:59:59 699

原创 2016Qcon上海《新媒体与深度学习》

​​作者 | 孙子荀编辑 | VincentAI 前线导语:2018年1月15日,微信创始人张小龙在微信公开课的演讲中提到了有关微信公众号的一些改变,包括公众号将会拥有自己的独立App。自微信公众号推出以来,就立刻成为了媒体人的宠儿,尤其在技术领域,对于技术人来说,一个靠谱的技术类公众号不仅是阅读的平台,更是学习和进步的阶梯。在AI迎来巨大发展的今天,本文将为你揭秘新媒体平台如何利用深度学习提供更...

2017-01-01 11:14:47 511

原创 <gcc> __sync_bool_compare_and_swap

跑的很欢的 代码 到了 gcc version 4.1.2 下面  __sync_bool_compare_and_swap 找不到了。。。 加了 -march 也不管用 。。 干脆自己写一个吧 参考gcc 的atomic.h   #define LOCK_PREFIX "lock;"#define __sync_bool_compare_and_...

2012-05-20 13:29:45 2026

原创 <linux kernel>plz do not use usleep(0)!

 最近发现很多hpc 领域的MPI程序中在用usleep(0) ,比较差异。 后来问了之前做hpc 的同事 得到的答复是一般用usleep(0) 的主要目的应该是:CPU交出当前线程的执行权,让CPU去执行其他线程。也就是放弃当前线程的时间片,转而执行其他线程 我感觉很诧异。 Usleep(0) 来做这个事情 是POSIX要求的 还是一个意外的发现呢? 我记得我之前都是...

2012-05-10 09:35:56 197

原创 rdtsc

  static void * thread_start(void *arg) { printf("Subthread starting infinite loop\n"); for (;;) continue; } static vo...

2012-05-07 09:30:47 457

原创 <linux kernel> RT8139c+ driver

  NIC register  IntrStatus = 0x3E, /* Interrupt status */  int cp_init_one (struct pci_dev *pdev, const struct pci_device_id *ent)|- dev-&gt;irq = pdev-&gt;irq;  Int Cp_open(...

2012-03-04 11:36:29 148

原创 [][][][][][]

 根据公司要求技术blog 涉及公司业务 只能在内网发布。从12年开始暂停更新 本人从事 linux 内核 , 分布式存储 高性能计算,机器学习,NLP 相关.  孙子荀 : 2年Linux内核 ,3年分布式计算存储系统 ,4年算法应用研究  联系: sunzixun@126.com  ...

2012-03-03 13:43:37 153

原创 <linux kernel> 3.2 pdflush change

 sync_inode - write an inode and its pages to disk. * @inode: the inode to sync  The function is responsible to synchronize all dirty inodes belongings to a given superblock    t...

2012-03-01 17:46:28 124

原创 <HPC>Torque 基本框架

背景 TORQUE provides administrators the ability to run scripts before and/or after each job executes. With such ascript, a site can prepare systems, perform node health checks, prepend and append te...

2011-09-05 17:50:40 247

原创 <cloud>iscsi kernel模块-网络部分

接口就是ioctl  没什么好说的 定义了一个上下文的 static DECLARE_MUTEX(ioctl_sem); 用来限制一次只能调用一个ioctl主要分为Session / Conn/ volume 增加 减少Param的配置修改先看临时一下 iet_socket_bind struct iscsi_conn { struct list_head list; /* l...

2011-07-05 10:22:36 319

原创 <linux net>tcp optimize

 tcp_sack :tcp_sack - BOOLEAN Enable select acknowledgments (SACKS). 1减小重复包。 /*This is what the send packet queuing engine uses to pass * TCP per-packet control information to the transmission code....

2011-07-04 09:29:19 129

原创 <cloud>Gluster ABC

 (可以直接转载 注明出处 有ppt 和pdf 如有需要请留言)  前言Glusterfs 是一个只需要软件的高效 可扩展 集中化管理的分布式存储系统。可以用于公有云,私有云环境。 这里就说企业私有云,公有云是收费的。 对于为创建一个灵活,经济,表现出色并且高效的分布式存储为前提的私有云环境,Glusterfs 提供了相当优秀的解决方案。他的好处有: 高效的本地和远程数据备...

2011-07-04 09:21:52 106

原创 <cloud> Glusterfs 3.2

  入门的就不提了,直接从入门之后的说起。。。    源码安装3.2   . 从3.0.8开始 glusterfs 这玩意本来文档就少的可怜,到了3.2压根就表明一点点。。 感觉gluster 不重视这快了,重点发展那个虚拟化平台。。 想了解个所以然 只有通过看代码。。。 3.2 中你会发现少了 scheduler 包括里面的 alu rando...

2011-05-19 11:03:29 133

原创 <cloud>How VG active Even uninstall LVM

主要分析 如何学习lvm 是如何保证卸载可用,来开发自己的lvm 。 关于lvm 的逻辑卷配置信息 ,上次说过了,一般保存在磁盘的头部一个元数据, 同时可以通过 pvcfgbackup 和restore 来恢复。这里可以实现迁移和恢复。  这次来看看lvm 卸载的效果。  你可以自己先试试看 ,在你卸载 lvm (apt-get purge lvm2) 之后,reboot后你的...

2011-04-26 14:49:11 126

原创 <linux> Device Mapper 和 Multiple Devices

   DM 和 MD 。。。 一个用于逻辑卷 一个用于软RAID 。都是虚拟的。。。   开始我也很好奇,如果同时启用2个设备,bio 是如何分发的。 现在有了点眉目。 先说一下iscsi 的理解。 简单的看了一下iscsi mod。我的理解就是 网络过来的数据包组织成了 struct tio 然后经过  block_io.c 的 static ...

2011-04-15 16:08:16 476

原创 <linux>from lvm2 to device mapper

  了解分布式存储的朋友 一定知道 lvm2 , PV LV VG等 ,简单看看lvm2是如何和内核交互的,为下一步开发自己的lvm 做准备  首先看 lvcreate 的调用走向  希望你自己摸索过lvm 也熟悉vfs ,fs子系统 ,这样可以一看就知道什么意思,然后大家一起交流。 lvm: dev_manager.c  /* * Add LV and...

2011-04-08 17:14:42 220

原创 <Linux Network 2.6.38>tcp_4v_recv

 假期结束, 根据上次讲的 ip_local_deliver int ip_local_deliver(struct sk_buff *skb){ if (ip_hdr(skb)-&gt;frag_off &amp; htons(IP_MF | IP_OFFSET)) { if (ip_defrag(skb, IP_DEFRAG_LOCAL_DELIVER))/*还原包*/...

2011-04-06 11:28:49 126

原创 <Linux Network 2.6.38> "where_to_go"

 先来回顾一个潜在的结构 在skb的 pskb_copy, skb_copy  等操作中起到了关键作用  写道struct skb_shared_info { unsigned short nr_frags; unsigned short gso_size; /* Warning: this field is not always filled in (UFO)! */ unsig...

2011-03-31 10:26:52 89

原创 <Linux Network 2.6.38> L2-L3

 __netif_receive_skb 是一个很关键的函数 ,可以看成L2-L3 的分水岭(如果该协议需要到L3的话) net_rx_action 做完了之后基本上  struct sk_buff{        //... ... ...        unsigned short  protocol;       // ... ... ...}; 就已...

2011-03-29 16:12:18 106

原创 <Linux Network 2.6.38> net_rx_action

 这个函数在2.6.35之后改动还是很大的   先回顾几个和 可调文件系统有关的 变量,下面的代码里面要提到用处 netdev_max_backlog------------------ Maximum number  of  packets,  queued  on  the  INPUT  side, when the interfacereceives...

2011-03-28 15:01:45 225

原创 <Linux Network 2.6.38> review

  书中 很多 地方 新的内核 除了壳子 都面目全非了, 研究内核就是痛苦终身的事情  。如果你订阅了mail list  那你肯定坚持不了一个月就 unsubscribe了  。   上层 recv send 二十年如一日 的调用  kernel 里面早就翻天覆地了 从 2.6.38的内核看来吧    以前看书从来不写blog , 现在发现写 还是有好处的 , 比如一年前如果我写...

2011-03-22 10:36:05 75

原创 <Linux Kernel>eventepoll3

 现在开始看看这个大家认为最应该阻塞的函数  , 从现在开始呢 我会通过源码分析一些大家对 epoll 模糊的地方 SYSCALL_DEFINE4(epoll_wait, int, epfd, struct epoll_event __user *, events,int, maxevents, int, timeout){int error;struct fil...

2011-03-21 17:40:00 73

原创 <Linux Kernel>eventepoll2

 下面来看看 epoll 的操作函数  epoll_ctl  SYSCALL_DEFINE4(epoll_ctl, int, epfd, int, op, int, fd,struct epoll_event __user *, event){int error;struct file *file, *tfile;struct eventpoll *ep;s...

2011-03-17 16:56:27 97

原创 <Linux Kernel>eventepoll

首先介绍一下Epoll 主要需要3个级别的锁  * 1) epmutex   互斥锁mutex * 2) ep-&gt;mtx   互斥锁mutex * 3) ep-&gt;lock   自旋锁spinlock 需要的顺序是从1-3 .  1 ) 需要自旋锁 : 是因为我们掌管着 poll 回调方法内部的资源 , 这些资源的触发可能发生在中断上下文 的wake_...

2011-03-11 19:40:53 192

原创 <Nginx> epoll

之后会把nginx使用的简单epoll skeleton  总结一下     // epoll检测到 EPOLLIN 调用之前注册的 ngx_connection_t r结构体指针1:         ngx_epoll_module.c :            rev-&gt;handler(rev); //开始处理http请求2:          ngx_h...

2011-02-24 10:40:14 121

原创 <Learn From Kernel> Mutex Subsystem

 在我想办法弄懂supermirco 服务用的Super IO w83795的驱动的时候 ,我不幸又陷入了mutex_lock : 具体的设计文档见 document/mutex-design. 我这里只是摘录演义~ 故事开始: "为什么在这个地球上 ,我们需要一个新的mutex 子系统 ,  原来的semaphore怎了么他不行了吗 "    让我来帮大家...

2011-02-17 17:36:10 100

<nginx> limit_rate

记得去年的一个 enhance FTP 的项目里, 有一个需求是要求  “针对每个IP进行限速 k ,然后对来自这个区域的所有IP 也要限速 K ”   因为应用是多线程多进程的。 就用了一个比较搞笑的方法 我叫他为《水桶法》 准备工作是创建一个消息队列 ,赶项目 就用了Posix的 1 每个连接都对应一个 con_id(独一无二)  2 每次该con_id收满 M...

2011-02-15 11:53:12 224

原创 <Learn From Kernel> printk_ratelimit()

今天在看ldd网卡驱动的时候,发现一个有趣的函数 printk_ratelimit()  他的主要做用和 prco文件系统下的,这两个接口有关系printk_ratelimit 定义了消息之间允许的最小时间间隔。printk_ratelimit_burst 定义消息数量  于是我机器上显示的就是 5s 内最多10条。 只是一个非常有意义的函数。 我们知道ld...

2010-12-25 21:03:58 230

孙子荀 构建内容建模的推荐系统

17年是内容分发的爆发年。各个自媒体平台,个性化阅读产品,都在争夺用户时间。分本次享主要介绍在内容分发领域的整体工程和涉及的算法技术。 1. 内容分发系统的系统框架; 2. 内容的控制和建模技术; 3. 内容推荐引擎的技术演变 1. 构建一个内容分发引擎,技术架构与挑战; 2. 算法策略模型如何与海量并发相互结合; 3. AI技术在内容处理上的落地

2017-03-25

SDCC 基于内容建模的推荐系统

SDCC 基于内容建模的推荐系统

2017-03-25

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除