NLP 实战(11): CSDN Daily,兼谈技术写作的问题

CSDN 极客日报社区 实验并推荐了一组以内容结构和质量为主的榜单,包含了这些不同的频道:

频道相关链接
铁粉增长CSDN铁粉介绍以及说明
每天值得看CSDN每天值得看–2022-05-20
每天分享能手CSDN 活动: 奖励每天的分享小能手
每天最佳新人CSDN 活动: 奖励每天最佳新人
一周精选如何在 CSDN 获得直接奖励 - 你也可以!
月度精选CSDN 创作者之夜
一周学习榜月答题挑战
2022/05/20

CSDN 社区功能更新:

  • CSDN 社区评论区打赏支持私信发送给被打赏的评论用户。如果你建立了社区,你也可以灵活使用该功能。

Need

CSDN 有很多不同的榜单,很多榜单以交互数据排序为主。但是我们知道交互数据好和内容好之间是有相关性,但不完全是因果关系。因此,我们设计了以内容结构和质量为主要衡量因子的数据推荐管道。

Approach:

以“每天值得看”为例,定义好以内容质量为主的目标,在算法方面:

  • 热榜以交互数据为主,我们用热榜的算法直接作为初始的召回计算
  • 过滤博文质量分,要求大于80分
  • 建立新老技术分类器,过滤老技术
  • 建立机器分级分类器(实验),配置初/中/高比例
  • 深度使用博文标签分类得分,让分领域博文有高度的领域相关性
  • 根据领域的新/老,做配比,压缩老技术数据,增加新鲜技术数据配比

在工程方面,有如下的优势

  • 基于 CSDN社区云 的社区能力,支持直接给上榜用户在评论区打赏,打赏是一个抛砖引玉的过程,我们直接和博主在留言区交流,共同探讨每一篇博客是否能改进,有什么好的改进方法,有什么值得写的技术主题。写是为了更好的思考,发生真正的交流,而不是水评。
  • 通过快速的迭代,持续的更新实验,能比较快地验证哪些是有效的策略,哪些是无效的做法,哪些算法起到了真正的作用,哪些算法的精度和覆盖度不足。

Benefit:

用户的获益

  • 有很多博主在CSDN 每天值得看上面获得了意外的上榜,留言表示开心。当博主写了有质量的博文,被算法识别出来上榜,对博主来说是一个很好的鼓励。
  • 我们的运营和算法工程师也会对上榜并且留言的博主直接打赏奖励,这是一个既鼓励博主创作,又有钱的榜,我们导向就是:“写结构良好的,内容质量好的博文”,我们希望好的导向鼓励更多博主关注内容本身的价值。
  • 每天值得看领域榜,也会被随机推送到 @CSDN每天值得读 ,获得更多的推荐。

Competitors

优质内容的竞争者不是别人,就是写作者自己,博主们逐渐建立起优质博文的意识,算法和推荐导向形成良性循环,才能在内容质量上获得共赢。

在今天这个知识爆炸的时代,信息不是太少,而是太多。人们不再有耐心写深度的优质的好文,追求短平快,甚至粗制滥造。早期技术启蒙的时代,技术写作者会追求技术的深入浅出,庖丁解牛,对新鲜技术保持敏感,持续跟进最新的技术。然而现在的信息变多,如何用中文写好技术却变得稀缺。一些典型的问题是

  • 不重视技术文章的基本排版,包括
    • 随意使用火星文,甚至连标题和目录都是表情包图标 ,我相信他们提交计算机作业文档给他们的计算机老师的时候不敢这样。实际上这降低了文章的品质,降低了文章的信噪比。
    • 随意使用各种表情包,好像写一段文字不发一个“囧”字,这段文字就没有感情是的 。这和即时聊天工具不无关系,人们在即时聊天工具里大量使用了短文本交流,以及大量使用了表情包,以至于在写技术博文的时候也带有这种习惯。总结出来就是好像不写一个“囧”字,文章就没句号似的。实际上这降低了文章的品质,降低了文章的信噪比。
    • 开头和结尾反复给自己打公告,介绍自己的各种头衔 。当一个读者来到了一个博客页面,开始读文章了,那就表示他对这篇博客感兴趣,这个时候开篇却是介绍这个博主是谁,这是一个很奇怪的逻辑。然后正文没读几段,文章结束,再次读到了这个博主是谁,有哪些头衔,而且里面还夹杂着很多表情符号和火星文。**实际上这降低了文章的品质,降低了文章的信噪比。**如果一个博文是好的,不用介绍其他人也会主动查看博客首页的作者信息,主动点击关注,而这样的关注才是博主的“铁粉”。
    • 开头反复放了大量的系列博客的目录 。每次进入博文要把系列博客的目录过了后才能读到正文。不能说这降低了文章的品质,但降低了文章的信噪比。系列博文有一个目录页面即可,其他的博文加一个到系列目录的超链接即可,或者文章的标题是“XXX(i): xxx”,并且把博文放在一个专栏里即可。
  • 不知道如何写技术博客
    • 罗列代码,没有多少解说 。有的文章没几个字,直接丢一堆代码上来。但是程序员连自己的代码都很多写完了不读,为什么他读你的博客的时候,没什么解释的情况下会看一大段十分通常不稀有的代码呢?技术文章讲解的时候,必要的代码是需要的,但是同时用列表、图示、伪代码来清晰地表达所要讲解的思路是常见的好的方法,是可以通过练习掌握的。
    • 没有一个清晰的分节层次 。有的文章不需要分节,例如一整篇文章是一个论说观点的文章,只要把文章的分段划分清楚,有基本的总/分/总,把一个观点解释清楚,那么它就是一篇结构起码合理的文章。但是如果是一个介绍技术细节的文章,至少应该有一个清晰的层次,开头介绍下必要的背景和目标问题,中间分小节展开写,最后扣题小结一下。
    • 不考虑读者对领域的陌生,堆砌领域局部操作 。技术领域分门别类太多了,每个人做的领域,另外一个人可能完全不熟。这种情况下会很多技术文章完全不考虑其他读者,但是他希望上榜,上榜就是所有人可见,所有人可见的情况下,应该考虑下一个问题:“其他读者对我这个领域可能是完全不熟的,他能看明白我在写的文章解决的问题是什么呢?他能从我解决领域问题的过程中理解和学习额到什么编程上的思维和能力呢?” ,有的文章看上去写的领域很高级,但是它既不是写底层的原理,有很好的计算机思维和编程上的普适性,也不能针对领域内的读者把领域内的操作说明解释的不错。这就跟一个程序员好像什么技术都会,但是给一个具体的任务,写出来的代码漏洞百出一样,是不靠谱的,质量不高的一样。
    • 更多的case可以持续更新…

Delivery:

CSDN 每天值得读,构建了以下的多渠道分发,初步形成良性的循环:

  • 极客日报社区 的持续构建,综合利用社区的发帖/评论/打赏/触达机制来建立循环。
  • @CSDN每天值得读微博 优质的技术应该推荐给更多人。
  • CSDN 百度小程序榜单使用每天值得看数据

一篇好文章最重要的要素是什么?

//@宝玉xp:一篇好文章最重要的要素是什么?
这是Twitter上网友madawei发起的一个问卷,他根据回复将答案整理了出来,分别从作者、文章、读者的角度总结了不同的要素,很有道理。

以下内容为转发自原文
——————————

根据一些回复整理了下👇
从作者的角度看:
- 有自己的见解、观点和立场
- 写作目的
- 引领读者
- 真诚

从文章的角度看:
- 言之有物
- 能把事情解释清楚
- 有结构有逻辑
- 有明确的主题,并能有分析、结果与建议

从读者的角度看:
- 引起共鸣
- 有趣有干货
- 读者喜欢 

创作是基于品味而思考的产物,而品味又是流量的敌人,如何均衡两者之间的矛盾是创作者需要思考的:
品味太高会导致受众过少,品味太低又会让作品显得平庸🤔 

最近看了很多泛技术的文章。一个困惑就是一些文章从标题看不出所需要的前置背景知识。
花时间读下来却疑惑更多,文章与读者阅读的鸿沟太大,也可能是文章触及了非目标读者,
最终让我产生了浪费时间的感觉。有没有办法像书籍一样快速的提示文章所需的前置条件帮助读者快速甄别?

一般读者触及一篇文章的场景是搜索、订阅或推荐,这三种场景都可能存在此问题,
后两者更容易出现鸿沟巨大的问题,但好的文章能隐藏或消减掉这种鸿沟,让目标读者读的更顺畅。
另外一个问题是作者如何能在这方面做的更好一些?

有意思的是这种鸿沟与推广之间也产生了很多联系,一篇文章主动推广做得好,很可能就是在解决这个问题,
比如文章的推荐语写的好,就是在精准的筛选目标读者,达到的推广效果也会不错。
如果一篇文章连推荐语也很难写,很可能文章写的主题就不明确。

Twitter上的一篇好的写作经验分享

//@宝玉xp:
Twitter上一篇很好的写作经验分享by coolXiao
🔗 twitter.com/coolXiao/status/1554667451203276801
🧵 网页链接
以下内容为转载


写作是可以改变人生的超级技能

但学校从没有好好教过我如何写作
于是我花了数百小时学习大师的写作方法

这里是我觉得最实用的10个技巧👇
1. 删掉“我认为”、“我觉得”、“我相信”等

为什么?

你写的本来就代表你的观点,不需要再重申,另外这些词会弱化你文章的可信度

• 我觉得你会喜欢这些技巧
• 你会喜欢这些技巧

第二句比第一句好100倍

我从 Nat Eliason 那里学到这个技巧:《21 Tactics to Help You Become a Better Writer》
🔗 www.nateliason.com/blog/better-writer

2. 先写标题

“写作是思考,写着写着我就知道主题”
这是 bull shit,别这么干

我写了400篇 blog,前200篇时,我最后写标题,导致全文主题散乱,
想法不连贯,表达不专注。知道这个技巧后,从下笔第一秒我就知道自己要说什么,这样才能把它说好

我从 Nicolas Cole 这里学到
🔗 www.youtube.com/watch?v=Od5J2V-Lmlg

3. 写出音乐感

我尽量写短句,但一直这么干,读起来很干燥

上面这三句就是一个典型的例子😄,写作应该长短结合,像写曲子,让读者从视觉上和听觉上感觉到韵律

我从很多人转发过的这张图片上学到这个技巧,并一直用它 

4. “triad”(三合音)

什么是三合音?

这是另一个关于节奏感的技巧,我从 The Adweek Copywriting Handbook 这本书里学到。
作者说他举例时,只举三个。因为这样读起来最有节奏感。

“于谦老师有三大爱好,抽烟、喝酒和烫头。”

感觉到节奏了吗?如果你看看我的 blog 和 newsletter
我也一直这么干😄 

5. CTA = call to action

这是一个广告常用术语,指的告诉读者如何行动。如果我们写的是非虚构类文字,最好包含至少一个 CTA

为什么?

你需要让读者有所收获,而告诉她们应该做什么,就是回报她们的最好方式

我在「可乐周报」里写下的每个想法,都包括一个 CTA
赶紧订阅👇 coke.do

6. 一寸相框

心中有个模糊的想法,却不知道如何动笔?

我经常这样,一个解决办法就是,一寸相框。和我一样喜欢酗酒的 Anne Lamott 的写作建议:
先写下眼前已经明确的,最想说的那个点子,不要考虑全文最后的呈现,先写下一句最想说的话,
最想表达的点子,已经成型的想法。 

7. 简单和清晰

智慧的最高形式是什么?

爱因斯坦认为是简单(simplicity)。当谈到写作时,他说:”为了更清楚地表达,我需要不断提醒自己,
丝毫不要在意呈现的优雅。“

你给我一篇冗长的文章,我就可以给你一个不清楚自己想说什么的作者。简单和清晰的观点,
是我从爱因斯坦这里学到的至高标准 

8. 不说副词

你可以从每一篇写作建议里找到这一条,说明专业作家有多么在意这件事😄。
我也一直不断地从自己的草稿里删掉副词,或者换一个更准确的动词

show,don't tell

不要用副词描绘情势,用更生动的叙述来替代它
Writing Handbook: How to practice writing
🔗 www.julian.com/guide/write/practicing

9. 填满画布

这是我在去年学到的最宝贵的十件事之一
🔗 coke.do/issues/2021-943183

写作难,如果没有十足的气势,难免半途而废。作家 Steven Pressfield 的建议是,
当开始写草稿时,应该一鼓作气,先填满画布。我们不能犹豫,因为犹豫就会败北。

想到一个点子,全部倒出来,你就胜利了一大半.

–end–

评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值