这里主要是根文库自己说明对文章审核的机制总结的一些提高审核通过率的方法不局限于定产任务。后期会更新如何提高AI文章的通过率。
首先,先说一下必须避免的问题,这个是不容侵犯的:
遵守规则:
1、确保你的文档内容不违反百度文库的社区规则和国家法律法规,包括但不限于版权、隐私、色情、暴力等敏感("设z"都懂吧?)内容。
2、尽量上传原创或有独到见解的内容,避免直接复制他人的作品,这样可以提高文档的质量和吸引力,也更容易通过审核。如果上传的是非原创内容,需要获得原作者的授权,并在文档中明确标注出处和版权信息。
3、广告、软文广告、图文广告、联系方式、水印、乱码、空白过多、泄漏隐私、模糊、遮挡、无法阅读、破解内容、机密文件、链接等
这些都是造成文档被拒的主要原因,但不局限于这些,很直白的能看到的问题就不要出现。
下面将一下标题问题(含原力任务):
百度文库标题创作规范
一、平台不支持的标题。
1)不规范:标题含有错别字或存在语病、滥用标点符号、语义歧义等,样例如
示例1:别吹牛逼,那真的很傻逼
示例2:,,,,试题。,,,人教版
示例3:语文试卷数学计算
2)不准确:无中生有,与实际内容不符等,样例如
示例1:标题:2020年最新试卷,内容:实际为2019年试卷
示例2:标题:小学一年级语文下册试题(含答案解析),内容:实际无答案及解析
3)不完整:标题信息表达不全,无法概括正文内容,样例如
示例1:哈哈哈哈啊
示例2:数学试卷
二、 平台支持
1)标题表达规范、准确、完整:
以教育类内容为例,标题内容包含必要元素“*类型、*学段、*科目、年份、地区、学校、教材版本、考试、知识点”等
原力任务是给你任务让你自己选标题.哪些任务不能选呢?
1、开头就带双引号的任务不能做
2、少于等于4个字的任务不能做(写完了上传的时候 会直接提示你标题少于多少字不让你传)
3、带\ |的特殊符号的不能做
4、带乘号的不能做
5、带复杂的汉字,任务看似能完成,但提交后说是乱码,不能做。
6、带敏感词汇的。
内容部分,比较多从优质文档、正常文档、低质文档三个方面说。
一、先说一下什么样的文档是优质文档,对于这个标准有一些难判定,主要体现在以下几个方面。
充分满足用户需求,无红线及基础体验问题,符合以下全部增值体验标准。
兑现度:内容信息完整详实,充分满足用户需求。
配图精美:使用符合主题的高清图,使文章更具观赏性。
排版一致:缩进、行间距、段间距一致,相同结构位置的字体字号统一。
二、正常文档 满足用户需求,无任何问题,但也无增值体验。
内容详实-丰富度:主题背景信息脉络清楚,由点及线,深入延伸介绍,如时间线、事件发展线等。
内容详实-满足度:实用度较高,主要评估该内容是否已满足标题所对应的用户即时需求。
排版清晰-信息结构:段落内标题信息、重点信息突出呈现。
如通过章节序号、首行缩进、段间距、字号、加相、字体颜色、下划线等任一形式。
页数>100页且有明确结构的内容有目录,方便更快获取内容脉络。
易误判例:精品合同范文50篇--无目录也可
排版清晰-段落&字体:段落首行缩进、行间距、段间距一致,相同结构位置的字体、字号统一。
易误判:部分PPT教案为强调重点,会存在句中部分文字加粗、变色、调大字号等,可凭优质。
易误判:部分PPT教案为强调重点,会存在句中部分文字加相、变色、调大字号等,可评优质。
三、低质量文档+基础体验
红线:存在严重准入问题。
基础体验:存在一下基础体验问题,影响阅读或理解。
标题:含有错漏字、多字、无意义标点、病句、少字、表情符号等。 存在错、漏、多字、乱码符号。
如:数学公式错位、存在乱码,影响对内容的理解。 行文质量-错漏字:题文兑现度差、错漏字、病句、排版影响阅读,篇幅少。
行文质量-标点错误:缺失标点,或者用空格断句,或标点符号使用错误,文档下载后需多次修正后才可使用。
如省略号的错误用法”。。。” 、 ”· · · · · · ” 、 “、、、” 、 “,,,”
行文质量-排版差:字体太小(字号<10pt),或页面拥挤,影响阅读。 转码异常(如页面加载过程出现卡顿)、无意义空白、空格、段落中换行。
排版混乱,字体、字号、间距等严重不一致,阅读体验极差。
部分PPT敦案为强调重点,会存在句中部分文字加相、变色、调大字号等,视为正常 以文字为主体的PPT,
背景色与文字颜色相近,难以获取文字信息,影阅读。
首页为封面页时空白较大视为正常:文未出现空白页>2页时即可算为低质:
页中出现空自页即算低质。
存在以下问题可能导致文档审核不通过。
图片质量-模糊:图片、文字图片不清晰、模糊(锯齿、 拖影等)、导致主体无法被识别。
图片质量-遮挡:图片主体部分出现遮挡/马赛克,或图文互相遮挡,影响信息获取。
图片质量-截断:图片被截断,影响正文信息完整性。
图片:模糊、变形、截断、遮挡,以及与正文不相关。
以文字为主体的图片被截断,无法获取完整信息(如拍照、截图的内容)。
非文字类的图片主体截断,含考试题插图、人、物等截断,造成视觉感知差。
以上问题致使无法理解或使用内容。
以上呢就是总结的文库自己对文章的判定的方法,避免以上所述不当的内容,可以大大提高文章的通过率,AI时代,下一章我会分享如何提高AI文章的通过率。希望对你有所帮助。