大数据时代:我们做好准备了吗

通过对海量数据的交换、整合和分析,发现新的知识,创造新的价值,带来新的发现,大数据时代正在向我们走来。“谁拥有了大数据,谁就占有了制高点。就政府而言,大数据必将成为宏观调控、国家治理、社会管理的信息基础”。


一如往常,11月宏观经济数据一出来,即引来各方专家解读。略有不同的是,来自统计业内的动向显示,包括CPI在内的统计数据正面临一场变革。这场变革是大数据时代的一种必然。


国家统计局刚刚与11家涉足大数据的领军企业签署关于大数据的战略合作协议,共同探讨如何在政府统计上应用大数据


什么是大数据?大数据在哪儿?有什么用?怎么用?与政府部门有什么关系?现在提大数据是不是有些哗众取宠、“危言耸听”?


举两个例子。在甲型H1N1流感爆发前几周,谷歌公司通过观察5000万条美国人最频繁检索的词条数据,发现“哪些是治疗咳嗽和发热的药物”这一主题的检索频率大增,进而准确预测了流感的发生及传播范围。美国地铁警察跟踪地铁抢劫案发生的时间和地点,分析原因和规律,制作出预测图表,使地铁抢劫案大为下降。除了商界的成功案例,大数据在政府管理上的非凡“身手”正在显现。


通过对海量数据的交换、整合和分析,发现新的知识,创造新的价值,带来新的发现,大数据时代正在向我们走来。


与不少发达国家已把大数据的开发应用提高到国家战略高度相比,我国的大数据管理还处萌芽状态。重定性、轻定量,重观点、轻数据的思维惯性,使得我们在数据收集、使用和管理上不太灵敏。比如,雾霾污染物的比例各是多少?城市机动车饱和量是多少?缺乏精确数据都让相关决策难以精准发力。


大数据不是“唬人”的标签,没必要对其夸大其词,也不能充耳不闻、敬而远之。


今年全国两会就有人大代表提出,可以通过分析春节期间移动用户漫游情况,掌握人口的流动规模与迁徙规律,为交通管理、铁路运输、公共安全管理等提供决策参考。这是挖掘大数据价值的现实建议。


大数据的能量往往超出我们的想象。在房地产价格统计上,银行的贷款信息及住建部门的网签数据能让房价数据更真实可靠;在就业领域,搜索引擎大数据可以帮助监测预警失业率和劳动力市场供求状况;道路上拍摄的交通影像数据可以帮助推算公路运输的货运量,等等。这些不是异想天开,它们一旦落地,将大大提高政府管理的精细化,提高决策的科学性。在医疗健康、食品卫生、地质灾害、社会舆情、信息安全、国土安全等领域,大数据的分析研究可以有效实现对于重大安全、危机、风险的防范和预警,大大提升国家治理水平。
“谁拥有了大数据,谁就占有了制高点。就政府而言,大数据必将成为宏观调控、国家治理、社会管理的信息基础”—国家统计局局长马建堂的话可谓高屋建瓴。
跟上新技术发展的脚步,从国家层面通盘考虑我国大数据发展的战略,在立法层面规范用户隐私保护、政府信息收集及发布、公共数据的开放等—我们做好准备了吗?
千万不可低估互联网等新技术的能量。运用这些技术,国家治理的能力与效率将大为提高。正可谓“用智慧的分析洞察,构建智慧的地球”。




NLPIR 2014
大会:汉语分词系统NLPIR 2014发布暨ICTCLAS用户交流大会

汉语分词系统NLPIR(前身ICTCLAS)从2000年诞生以来,历时14年,全球用户突破30万,先后获得了2010年钱伟长中文信息处理科学技术奖一等奖,2003年国际SIGHAN分词大赛综合第一名,2002年国内973评测综合第一名,已经成为中文信息处理领域标杆性的工作。ICTCLAS创始人张华平博士倾力打造,即将推出的NLPIR2014版,是迄今为止最大的一次更新,在汉语分词体系架构下增加了对英文词法分析的支持,可以自动识别英文词汇的原型、词性标注、命名实体与关键词;并在当前汉语词法分析的基础上,实现了文档的完整语义分析,自动提取文档的人名、地名、机构名、文章作者、发布的媒体、关键词与摘要,是当前中文信息处理的必备神器,值得期待!

我们即将召开NLPIR2014发布暨ICTCLAS用户大会,由北京理工大学大数据搜索挖掘实验室主办,计算机世界与大数据论坛联合承办。张华平博士诚邀历年来所有支持我们前行的ICTCLAS用户,中文分词及中文信息处理的技术爱好者莅临参加,分享中文语言智能理解的美妙。届时,张华平博士将亲自讲解NLPIR2014背后的技术原理与最新进展,并由资深工程师在不同操作系统不同开发语言下NLPIR的实训技巧,同时还有不同背景的资深用户分享他们的使用开发经验。

在线报名:http://118.192.14.52/bigdatatrain/bm.jsp(请注明NLPIR2014;场地有限,只接收前100名

基本信息

会议形式

(a) PPT算法讲解;

(b) NLPIR2014系统演示与实际开发操作;

(c) 针对学员具体需求的互动交流会

(d) 提供专属U盘:保护NLPIR2014的演示系统、各类试用的API以及新版开发手册;

会议时间

12月21日上午9:00-12:00,下午13:30-17:00 ( 17:00-18:00 开放式讨论答疑 )

门票费用

(a)1400 (包含门票,NLPIR2014演示系统、开发包与文档, U盘,工作餐,赠送由张华平博士亲笔签名的《大数据搜索与挖掘》专著);

(b) 12月10日前缴费优惠价1300元;老学员或同单位三人以上报名九折优惠;全日制学生凭学生证会费优惠价格980元,不含发票。

(c)名额有限,参会者需在参会前提前购买门票。

(d)差旅及食宿费用自理。

与会嘉宾

主讲人:张华平:NLPIR(ICTCLAS)创始人与开发者,北京理工大学大数据搜索挖掘实验室主任,博士,副教授

主持人:赵燕平:北理工经管学院教授,北京理工大学大数据搜索挖掘实验室副主任

特邀ICTCLAS典型用户嘉宾待定(将包括跨国企业、金融、政府机关、科研院所、投资与互联网等代表性用户)

会议地址

北京理工大学理工国际交流中心

在线报名:http://118.192.14.52/bigdatatrain/bm.jsp(请注明NLPIR2014;场地有限,只接收前100名

ICTCLAS创始人张华平博士简介

2005年博士毕业于中科院计算所,研究方向为:微博计算、自然语言处理、信息检索与信息安全、大数据搜索与挖掘。曾先后获得2010年度钱伟长中文信息处理科学技术奖一等奖,中科院院长优秀奖、中科院计算所所长特别奖,中科院计算所“百星计划”首批入选者。张华平作为课题组长主持开发了国家自然科学基金、863、973、242等科研课题十余项,发表《大数据搜索与挖掘》《信息检索:算法与启发式规则》《自然语言理解》等专译著3部,所研制的ICTCLAS分词系统已经向国内外的企业和学术机构颁发了三十万多份授权,在学术界和产业界得到了广泛的应用。并作为特邀技术专家,先后在中央电视台、全国网络侠客行大会、全球大数据技术峰会、中国网络科学大会上做大数据相关的主题演讲,广受好评。

会议日程

时间

讲师

环节

主要内容

8:00-9:00

各位参会人员

会议报到

签到,领取各项资料。

9:00-9:20

赵燕平教授

大会开幕式

开幕式致辞,嘉宾与学员介绍

9:20-09:50

张华平博士

NLPIR2014发布

1)     NLPIR2014功能展示:分词、词性标注、命名实体识别、新词识别、英文分析、关键词提取;

2)    NLPIR2014开发包介绍

09:50-10:10

 

合影留念及茶歇

 

10:10-12:00

张华平博士

NLPIR2014汉语分词关键技术及最新进展

1.  ICTCLAS的层叠隐马分词模型(汉语分词、未登录词识别、词性标注)

2.   ICTCLAS的词典管理专利算法:完美双数组TRIE树;

3.  新词识别与关键词提取算法原理;

4.  NLPIR2014英语词法分析技术;

12:00-13:30

 

工作午餐

 

13:30-15:00

张华平博士

康肖钰硕士生

张冰波硕士生

NLPIR2014汉语分词开发包使用实训

1.    NLPIR2014 C/C++语言调用实训

2.    NLPIR2014 Java语言调用实训

3.    NLPIR2014 Linux调用实训

4.    NLPIR2014 高级编程实训(多线程安全、用户自适应分词、python调用、关键词提取等)

15:00-15:30

朱勇高级工程师

NLPIR示范应用:黄金眼Web大数据搜索与挖掘平台

主要介绍利用NLPIR系统开发的黄金眼Web大数据搜索与挖掘平台,展示主要功能与背后的实战应用经验,目前已经应用于工信部、总参、财经杂志等单位。

15:30-16:00

姜伟(北京外事办信息中心主任)

NLPIR示范应用:政务公文主题词提取系统

主要介绍利用NLPIR系统开发的政务公文主题词系统,历经十余年,目前已经应用于大部分政府机关。

16:00-16:30

罗文川(缔元信CTO)

NLPIR示范应用:缔元信网站统计数据挖掘与应用

主要介绍缔元信利用NLPIR系统开发的互联网网站统计数据挖掘与应用,是目前网站统计方面权威的机构。

16:30-17:00

待定

 

 

17:00-18:00

 张华平博士

交流沙龙

 可与ICTCLAS创始人张华平博士直接交流讨论


名额有限,先到先得,参会报名热线:

张老师 13681251543    Email: zhangjie@bigdatabbs.com

官网支持:http://ictclas.nlpir.org

在线报名:http://118.192.14.52/bigdatatrain/bm.jsp(请注明NLPIR2014;场地有限,只接收前100名



转载于:https://my.oschina.net/u/1160813/blog/183302

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值