【概念与使命】
社会计算包括三个方面:计算社会科学、社会软件(Social Software)和群体智慧,这么分更妥当,原来我称社会软件为“社会计算应用”,但“计算社会科学”有很多重大应用,比如辅助制定人口政策,这些应用可以跟人们之间的沟通与协作无关。社会软件和群体智慧也可以有自己的理论。
“计算社会科学”与“社会计算应用”的关系类似于“计算语言学”和“自然语言处理”的关系,前者均属于科学范畴,后者均属于技术范畴。
深刻地全面地量化地理解社会,为解决社会问题给出有效的参考意见,是社会计算的使命。
【潮流与趋势】
当一门学科发展到一种极致,如果不深刻理解环境的变化(比如社交媒体、群体智慧的出现),不努力从其他学科吸收营养(比如组织行为学、传播学、心理学),很难再向前迈进。在标准测试集上些微的指标提升是没有本质意义的,而且很多指标的提高说不清到底为什么会提高,以数据压人,而不能以理服人。
运动有6种:机械、物理、化学、生物、思维和社会。对每一种运动的研究都需要数据,基因测序的突破为生物信息学提供了数据,社交媒体和位置服务等为社会计算贡献了数据,催生了新的学科。
从机器互联到信息互联,然后兵分两路,一面人与人互联,一面物与物互联,然后奏响以机器为载体,以信息为纽带的人、物交响乐。
我关于人本计算的观点是有争议的,有网友认为:人本计算只是暂时,纯机器智能才是科学,才是最终目标,而我认为人机协同是终极状态。
“群体智慧”是独特的,以电脑为辅助,以互联的人脑为计算节点,以前没有过。“群体智慧”不一定为处理社会需求服务,只要是把一群人脑动员起来,无论解决什么问题,都是“群体智慧”。
以前做NLP和IR的题目都重在“识别”,而现在做社会计算有很多题目是“预测”,需要好好研究一下各种预测模型。预测需要验证,股价数据是公开的,便于验证。另外,股民数量巨大,对股价走势是发自内心的关切,需求非常强烈。股价每时每刻都在变化,无法靠人工实时分析数据,所以必须引入自动分析技术。
【信息质量】
最精准的广告就成了信息服务,不但不打扰用户,还对用户很有帮助
搜索引擎只解决了信息的相关性问题,但找到的内容不可信,徒然浪费时间,浪费资源。“可信内容”的研究目标就是“为用户提供真实的信息”,脱离现有搜索引擎“准全快新”的评价标准,而是比“真”,这也是一种破坏性创新。
【微博带来机会】
微博给学者带来了机会,包括数据,包括用户。微博将使学术界一定程度上摆脱被数据困扰的局面。
微博上有四种人:读者、记者、编辑和评论员。
对社会计算的期许还来自于微博系统的平台性,微博一定要保持平台定位,而不能自己做应用。广大开发者日后赚了钱一定要跟平台分成,形成良性产业链。如此,会给中小企业,个人创业者和大学在校生们留下巨大的创新空间和利益空间。
对社会计算的憧憬很大程度上来源于微博系统数据的开放性,在搜索引擎时代,由于隐私保护和商业竞争的需要,企业不对学术界开放用户数据,个性化技术无法展开。现在我们浏览一个人的微博,他的职业、兴趣、社会关系一览无余,连他几点起床,用什么手机都知道,这在以前是不可想象的。
以往中小开发者还非常缺乏营销渠道,以前是有论坛,但论坛是一个个信息孤岛、人群孤岛,而且论坛上还有版面,更是把人群相互隔离了。微博,全中国一个大论坛,一个版面,只要你的东西好,就可能引发指数级爆炸式传播。
有时我发一条技术方面的微博,就有一些粉丝取消对我的关注,此时,微博成为社会关系断裂的触媒。在微博洪水流动的过程中,社会关系网络不断重构,上演着人和信息的双重变奏。