经济观察报:新浪打造网络新闻的工业化实验

经济观察报:新浪打造网络新闻的工业化实验

http://www.sina.com.cn 2004年05月08日 09:49 经济观察报

  本报记者 王方剑 北京报道

  互联网对于人们获取信息的方式和价值取向产生了重大改变,人们已经由被动接收信息向主动获取信息转变——汪延

  “再过一段时间,我们就要出个规范的编辑手册,现在正在征求意见的阶段。”

新浪网全球资深副总裁、总编辑陈彤4月15日这样告诉记者。

  或许,当陈彤顺口而出说出这句话时,他并没有刻意去对比自网络新闻诞生以来这几年中国网络新闻产品制造水准的进步:网络新闻产品已经从诞生时“Ctrl C+Ctrl V”原始水平发展到了工业化、标准化的时代,而新浪网正在国内门户网站中率先进行着这样的探索和实验。

  中国网络新闻产品的制造水平飞跃了。

  在北京西三环外幢不起眼的白色四层小楼里,中国网络新闻产品的工业化实验正在继续进行。

  “新浪们”的价值

  “如果今天的社会没有了互联网,你能想象出来人们是什么样子吗?”陈彤说,“肯定不能接受,就像现在社会没有了电一样。”但如果一定要归纳出以新浪网为代表的网络媒体给中国社会,公民带来的革命性的变化、冲击,即使是浸淫网络经年,陈彤也感到为难:“毕竟我不是网络研究专家,网络给社会带来多少变化我们看来是难以穷尽的,只能大致数一数,列举一下。”陈彤说,除了搜索资料、电子邮件等服务之外,在新闻的即时与滚动播出,容纳内容的无限性,意见的互动性等综合方面的网络媒体的优势是纸质媒体、电视媒体很难比拟的。

  零时差消息传递。当人们谈起互联网的感受最深的一点就是“快”,事实的确如此,由于国际互联网最大限度的消灭了制作周期,使得消息的上网时间与事件实际发生的时间正在逼近零时差,与报纸、杂志和电视台等媒体类型相比,网络媒体的制作周期优势是最明显的。

  人们获取信息尤其是新闻的最主要途径之一,由于互联网的出现使得近年来网络媒体成为报道重大事件最多的媒体类别,其中尤其是以新浪网最具有代表性,国内报道1999年美国炸中国大使馆事件最早的媒体,报道美国“9.11事件”最早国内媒体……新浪网在多次重大事件中的出色表现,使得人们养成了“看新闻、上新浪”的习惯和心理预期。包括党和国家的领导人在内,都将网络作为获取信息的重要渠道之一,他们在公开场合曾经多次说过,“我在网络上看到……”,“我在网上知道了什么什么”,等等。

  交往范围扩大了,由于网民的迅速增加和网上聊天交流工作的发展,“网上聊天”“见网友”成为人们新的交往方式,这种新鲜、虚拟的交往方式降低人们交际成本的同时,极大地扩大了现代人的交往范围。从理论上讲一个中国人只要他能上网聊天,在理论上他是可以和8000万网民交往的。

  最大程度地反映了普通人的声音和意见。互联网上“网友论坛”设立,使得广大普通人发表自己的声音和意见成为现实,譬如国产新车丰田花冠的价格究竟高不高,那些在国外没有生活过的网民很难有准确的判断,而在欧洲、台湾工作生活过的在网上发表的车价评论就在很大程度上帮助人们作出判断,提供很多有说服力的数据和资讯。网络容纳普通人声音和意见的无限性、直接性和真实性,也是人们爱看网上论坛评论的重要原因。

  互联网对社会的深远影响还表现在推进了中国人道德观念的转变方面,如果要是在几年前谈起“一夜情”现象,社会上大多数人会认为是“不道德”或者是“一个带有贬义的词”,由于这几年网络的发展和社会观念的转变,使得人们已经开始认为“一夜情”是一个“偏中性”的词了。

  正是由于以新浪网为代表的网络媒体,才有了网络对社会如此深刻的影响。

  网络新闻产品的“工业化”

  但是要继续产生这些价值、产生更大影响力,继续赢得数千万网民的尊敬,“新浪们”在进行更多的探索。

  毫无疑问,网络容纳类似的无限性是网络的优势。但是这种优势也给门户网站带来了一个全新的难题:新浪网每天需要处理或更新以千或者以万计的信息,面对如此大规模的业务,门户网站内部在内容方面应该如何组织生产?

  如果,今天你还认为网络新闻只不过是的“Ctrl C+Ctrl V”话,那你就大错特错了。至少新浪网已经在网络新闻产品的市场分析、市场定位、产品生产流程和组织架构上作出了很大不为人知的有益的探索。因为今天网络媒体与纸质媒体、电视媒体之间的竞争、网络媒体与网络媒体之间的竞争已经相当激烈,谁要想领先哪怕是一小段距离,对其内功都是一个严峻的挑战。

  如果把网络新闻产品看做是成品的话,那么新浪网产业链前面报刊社台网的新闻产品就相当于“半成品”,甚至是网络产品的“素材”,在这个意义上,报刊社台网就相当于一次采集商、制作商,而新浪网等网络媒体就在扮演着一位二次制作商和集成商的角色,也就是说从“半成品”“素材”到最终上网的网络新闻产品之间,一般还要经历“获得素材(半成品)——确定制作方向——整合信息与包装——播出(补充与完善)——流量检测与管理”等很多环节和流程,新浪网在这些环节和流程的工业化、标准化方面已经作出了很好的探索。

  一句话,门户网站已经在网络新闻产品的“工业化”之路上走了很远。

  在那幢不起眼的白色四层小楼里穿行两趟,走过聚精会神,头也不抬的编辑身旁,你就会感觉到新浪网网络新闻产品的生产已经进入了工业化时代,那些戴着深度近视镜的白领的工作特征其实和软件公司的程序员,甚至和珠三角、长三角的流水产业工人没有什么实质的不同。只不过是产业不同、生产的产品不同、产品性质有些差异而已。

  新浪网新闻产品生产系统的组织架构,并不比制造业逊色,在新浪网40多个频道背后有200多名新闻编辑其中有20多个主编,在这些主编之上还有6个总监,这些总监直接对总编辑陈彤负责,编辑—主编—总监—总编辑的职级顺序,与职员—经理—总监—总裁的组织架构并无二致。

  在新浪网上,最终产品主要分为两大类:新闻类和信息类,新闻类的比如财经、科技体育、娱乐等频道,信息类如游戏、读书、旅游等频道,当然有时两者也有交叉,一个频道中可能主要是新闻类产品,但还有信息类产品,或者相反。

  在新浪网上,新浪产品大约也10多个品种,这些品质大致可以分为两类:松散型专题和紧密型专题。

  打开4月16日新浪网的财经频道,可以发现,“德隆系会崩盘吗?”的新闻专题显然属于松散类型专题,新浪网只是把有关近期德隆的新闻,分成了的“最新动向”、“与德隆有关的上市公司动向”、““与德隆相关的公司动向”、“德隆大事记”几个类别放在了一起,基本上没有进行太多的加工,而“造系运动之托普”新闻专题则属于紧密型专题,因为新浪网不仅把有关托普的近期新闻放在了一起,还把近两年关于托普的新闻报道都放在了一起。同时进行了一些原创性的文字连接和梳理,并按照逻辑分为了“宋如华与托普集团”、“宋如华的造纸系之旅”、“托普的回归之路”、“众说纷纭脱托普系”四个部分,这个专题对读者的价值就比较大。

  最终产品的高度细分,反映了新浪网产品的工业生产水平。

  “精细化”已经上路

  很难想象到生产精神产品的新浪网在工业化之后已经开始了“精细化”。

  据陈彤介绍,新浪网在1998年开始做新闻的时候,就已经零星地制定了一些网络新闻的制作规范,随着新浪网影响的扩大和内容的大规模增加,又陆续制定了一大批工作规范,而到了今天,新浪网制定工作规范主要是涉及到内容精细化方面的制度。

  记者在现场看到了一份《内容发布及工作规范》,该手册厚达118页,共有《关于未获许可不能转摘的几种情况及相应规定办法的规范》,《关于图片新闻中的图片说明及图片发布规范》第48条规范性制度,记者在这个打印而成而非印刷而成的手册内页上看到,针对个别章节和条款有一些手写体补充和修改,看来这个工作规范仍在不断地完善中。“这只是一个总的规范,各主要频道都还有自己的具体工作规范,都加起来应该有上千页了吧。”陈彤告诉记者。

  陈彤在4月16日接受补充采访时告诉记者,新浪内容生产的精细化,首先反应在具体业务上,譬如,一场比较重大球赛,新浪一般会派出几十名编辑去盯,比分变化、技术统计、进球描述、进球手绘图、对阵双方战绩、主要球员的排名和近期战绩、场外花絮、嘉宾点评,等等,分工之细微已经到了近乎穷尽的地步。

  经常使用和依赖辅助工具,也是新浪内容生产精细化的表现,比如,在新浪网上很多信息,大量使用图品甚至有些栏目或者专题就是以图片为主的,这些时候图片的规范使用就不仅仅是内容、风格的问题了,甚至会影响到信息的传输速度和网民的满意度。为此新浪网专门制作了一种软件,将图片规范为7种,图片的长、宽、像素都有统一的规定,编辑制作图片时,只要把他想制作的图片放到规范格式中,一张标准的合乎要求的图片就自己生成了。

  其实,新浪内容生产的精细化还表现在很多方面,大到制度的规范和建设,小到细微末节的地方,比如很多需要键入字节的空格内,一般网站是把“请选择XX”放在空格内,而新浪网会把大多数人选择的那一项直接放在空格内,这样就省去了网民还要点击一下才能选择,尽管这是非常细小的地方,但反映了新浪网的精细化理念和工艺。

  可口可乐公司靠一份配方和一套系统在全球复制,靠一瓶“红糖水”“卖”进了500强,与新浪网过硬的网络新闻产品相比,陈彤更看中产品背后的这套生产系统和生产工艺,有“好产品重要还是有让产品好的方法和系统重要?”陈彤这样问记者。

  事件

  1、在2001年的“9.11”事件中,新浪网成为国内最早报道该恐怖袭击事件的媒体,事件发生后10分钟(20点55分),新浪网就发布了第一条消息。

  2、2003年3月美伊战争的报道中,新浪网在战斗爆发统一时间点上,既发布了第一条快讯新闻,截止当日中午12点,新浪网访问人次达到3000万,网友评论22000条。

  2、2003年10月15日,新浪网大量报道我国的首次载人航天圆满成功,当天访问量既超过1亿人次,从15日飞船发射开始,新浪进行了长达到18小时的视频和图文直播,制作了20段视频和35个flash,组织了近20次与航天专家和前方记者的在线访谈和电话连线。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
好的,这个问题需要用到Python的爬虫技术,具体步骤如下: 1. 导入必要的库 先导入requests、BeautifulSoup库,来实现网页的请求和解析。 ```python import requests from bs4 import BeautifulSoup ``` 2. 确定爬取的网站和页面 我们需要爬取新浪、网易、今日头条、UC四大网站的新闻标题和内容,因此需要确定每个网站的新闻页面的URL。 以新浪为例,它的新闻页面URL为:https://news.sina.com.cn/china/,我们需要爬取这个页面上的所有新闻标题和内容。 3. 发送请求并解析页面 使用requests库发送请求,获取新浪新闻页面的HTML源码,然后使用BeautifulSoup库解析HTML源码,得到新闻标题和内容。 ```python url = 'https://news.sina.com.cn/china/' response = requests.get(url) html = response.content soup = BeautifulSoup(html, 'html.parser') ``` 4. 提取新闻标题和内容 使用BeautifulSoup库提取新闻标题和内容。 ```python # 提取新闻标题 titles = soup.select('.news-item h2 a') for title in titles: print(title.text) # 提取新闻内容 contents = soup.select('.news-item p') for content in contents: print(content.text) ``` 5. 爬取其他网站 对于其他网站,只需要重复上述步骤即可,只需要修改URL和CSS选择器即可。 完整代码如下: ```python import requests from bs4 import BeautifulSoup # 爬取新浪新闻 url = 'https://news.sina.com.cn/china/' response = requests.get(url) html = response.content soup = BeautifulSoup(html, 'html.parser') # 提取新闻标题 titles = soup.select('.news-item h2 a') for title in titles: print(title.text) # 提取新闻内容 contents = soup.select('.news-item p') for content in contents: print(content.text) # 爬取网易新闻 url = 'https://news.163.com/' response = requests.get(url) html = response.content soup = BeautifulSoup(html, 'html.parser') # 提取新闻标题 titles = soup.select('.item-top a') for title in titles: print(title.text) # 提取新闻内容 contents = soup.select('.item-wrap p') for content in contents: print(content.text) # 爬取今日头条新闻 url = 'https://www.toutiao.com/ch/news_hot/' response = requests.get(url) html = response.content soup = BeautifulSoup(html, 'html.parser') # 提取新闻标题 titles = soup.select('.title-box a') for title in titles: print(title.text) # 提取新闻内容 contents = soup.select('.abstract') for content in contents: print(content.text) # 爬取UC新闻 url = 'https://news.uc.cn/' response = requests.get(url) html = response.content soup = BeautifulSoup(html, 'html.parser') # 提取新闻标题 titles = soup.select('.item-title a') for title in titles: print(title.text) # 提取新闻内容 contents = soup.select('.item-desc') for content in contents: print(content.text) ``` 注意:在实际使用中要注意网站的反爬机制,避免被封IP。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值