萨师煊大数据研究中心第二届"大数据视点"研讨会

“Big Data Perspectives” Workshop

 

会议名称:萨师煊大数据研究中心第二届"大数据视点"研讨会

会议地点:中国人民大学逸夫第一报告厅
会议时间:2013年7月8日

Program

 

9:00am-9:30am: Opening speech, Prof. Xiaoyong Du, Prof. Xiaofang Zhou, and Prof. Ji-Rong Wen (Renmin University of China)

 

Keynote Speech

9:30am-10:30am: “Big Data and Lifelong Machine Learning”, Prof. Qiang Yang (Huawei Noah Ark Research Lab)

 

Morning Session

10:30am-11:00am: “Real Issues in Big Data”, Prof. Charles Ling (University of Western Ontario)

11:00am-11:30am: “Big Data: Science or gimmick”, Dr. Xueqi Cheng (ICT, CAS)

11:30am-12:00pm: "Deep learning - A new wave of machine learning for big data ", Dr. Kai Yu (Baidu Inc.)

 

12:00pm-1:30pm: Lunch Break

 

Afternoon Session

1:30pm-2:00pm: “Sensing the Dynamics of the Web”, Prof. Ji-Rong Wen (Renmin University of China)

2:00pm-2:30pm: “Relevance in big data: an IR perspective”, Prof. Jian-Yun Nie (University of Montreal)

2:30pm-3:00pm: “Web-Scale Entity Mining and Crowdsourcing”, Dr. Zaiqing Nie (Microsoft Research Asia)

3:00pm-3:30pm: “Big Data and Big Data Technologies: A Database Perspective”, Prof. Ling Liu (Georgia Institute of Technology)

 

3:30pm-4:00pm: Tea Break

 

Panel

4:00pm-5:30pm: “How to do big data research in academia”, All speakers

 

会议感受:

与会专家各抒己见,畅所欲言。演讲非常精彩,尤其是下午的Panel将整个会议推向高潮。

演讲主要从机器学习、信息检索、web Mining,database等几个角度来看待大数据。从演讲内容上来看。大数据到底是什么,依然是我们探索的问题。

或许我们根本不需要这么急切的定义大数据是什么。而更应该做好手头的工作。就像我们勤奋做好本职工作,就是给国家发展,为**主义而奋斗是一样的。

行动就是最好的诠释。

 Panel将整个会议推向高潮。

主要从国内、国外,学术界、工业界几个方面展开了讨论。

七位专家在台上就大数据的学术研究展开精彩的对话,不断有精彩的碰撞和火花。

期间也涉及到了大数据的隐私保护、安全策略等方面。

谈到了google、facebook的白手起家,也谈到了百度、华为的最新战略。

谈到了博士硕士如何搞学问。

王珊老师虽然没到台上,但是也就数据库技术、数据库研究者在大数据研究中的作用发表了自己的看法,这点和刘伶老师以数据库技术的观点看大数据研究的演讲不谋而合。

 

 

下面是我自己的一点想法,

首先,演讲老师们多次提到大数据的3V或者4V或者5V。个人理解。无论是几个V。都是以一个V为核心追求。那就是Value。

无论是谁,在大数据研究面前,都有一个Value目标。从个体方面,有的人心里的Value就是金钱,有的人就是Intrest。有的人为了娱乐,有的人为了方便生活,

从大体来看,有的人为了自己国家的发展,有的人为了国防军事,数字殖民。这都是Value、

所以,Value是所有大数据特点里,最核心的V,是内涵。其他几个V都只是他的外延而已。

一句话,没Value目标,我们劳民伤财干什么?

所以:

(一)大数据的Value至少是不对称的。一个项目的立项,到底有没有价值,有还是没有,正价值还是负影响,就是一个不对称。

一个项目,对你有价值,对我可能没有价值。甚至讨厌。这也是不对称的。所谓的推荐系统,绝大多数的垃圾广告邮件投放,骚扰电话、弹窗广告。你倒是收到了广告效应了。我的访问体验受到了干扰。

一个项目,对美国有价值,对我们可能没有价值,棱镜计划,你懂的。

 

(二)Value也具有时效性。现在有价值的项目,可能明天就没有价值了。

(三)大数据的Value可能还有欺骗性。

zhengzhi干预、人为造假,局部数据,都可能使得我们获得的Value是片面的,甚至是虚假的。某搜索引擎可以花钱买排名,有很多人在淘宝购物之后,根本不愿意评价,系统默认会好评,等等,这些都可能导致大数据的分析结果和事实不符合。甚至奥巴马获胜都是人家两个人商议的结果,那么多的机构在做预测,纯属娱乐。还不如预测明天的天气有价值。

大数据的Value应该还有其他的一些特点。目前我也想不到。。。。。。

 

第二个观点:人在大数据领域的重要性

软件工程产生的背景是软件危机。

面对大数据的潮水,有人也在制造“诺亚方舟”,可是这个方舟该怎么造?怎么驾驶?

软件工程最终有了软件开发技术和软件项目管理。从技术、工具、方法等方面研究和指导开发。从政治、经济、法律、哲学、管理等方面研究和指导软件项目的管理。

一句话,在大数据来临的时代,我们只关注大数据的处理技术,工具,和方法是不够的。为了避免软件危机的胞妹“数据危机”也不期而至,我们也该想软件工程一样,考虑一下另外一个至关重要的角色------“人”。

人在大数据的研究使用中至关重要。

(1)人作为大数据重要的提供者

WEB2.0时代,人人都可能成为大数据的提供者。如何正确、自愿、规范、标准的提供大数据,不论是自觉的还是被动的,人都直接左右了大数据的来源。

在考虑大数据的欺骗性时,就说明了这个问题。有的国家或者机构,不愿意拿出自己的数据共享,这也是可以理解的。有的人,不愿意把自己的信息共享,这也是可以理解的。

作为大数据的研究者,应该考虑怎么样获取大数据,包括采用政治、经济、法律、心理学、管理学等角度,来促进大数据的良性发展。

(2)人作为大数据的处理者

大数据工作者的技术、能力、思维方式等等,都在历史的影响这大数据的前进和发展。就像当初“制造”软件危机的人一样,目前是不是也处在盲目的狂然时代呢?是否也处在“小作坊”时代呢? 如何让“软件危机”的故事不再发生在大数据领域,如何避免“数据危机”,人,尤其是大数据工作者,起着至关重要的作用。

数据危机会不会发生在下图所示的低谷位置呢?

(3)人作为大数据的使用者

大数据的核心追求就是VALUE。而人是VALUE的最终享受者。无论你做什么项目,要考虑目标人群是谁,他的价值目标是什么。就像是做软件工程,弄明白用户的需求很重要。做大数据,也要弄明白数据的需求。

 

 

概括一下,

(一)大数据的核心特点是VALUE.

(二)大数据的研究是不是可以和软件工程一样,成为一门独立的学科呢。

考虑软件、硬件、和人,考虑技术也考虑管理。

如果是,叫“数据工程”或者叫“大数据工程”合适不?

 

 

以上纯属个人意见,思想过观点受个人知识水平所限,难免狭隘。如有异议,欢迎批评。

 

 

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值