但行好事,莫问前程。

得数据者得天下——《大数据》

2013-01-04

这年头,见面不聊两句大数据,你都不好意思说自己是互联网圈的。

涂子沛的《大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活》可不是教你如何采集、存储、分析、可视化大数据的,这不是一本技术书籍。他为我们描述了美国的开放与民主之路,三权分立的美国如何围绕数据公开、发布相互制衡。并对数据的采集、管理与使用所遇到的诸多问题进行利弊分析,为我们国内数据开放提供宝贵的借鉴。

关于数据采集成本:大数据平台的建设成本极高,政府是否有资格用纳税人的钱建立大数据平台?多个平台之间采集数据如何有效共享,并避免重复收集?需要制定数据的管理标准与规范。

关于数据质量:美国的数据质量法是长期斗争的成果。数据一旦公布就会面临公众挑剔目光的审查,如何确保公布数据的准确性的确很棘手。但是发布一些不准确的统计局数据只会干扰社会系统。

关于隐私:人们散落在网络上的各种片段数据,如果集中到大数据平台将会真实还原这个用户的一切行为。人肉的力量已经让中国的网民深有感知,如果将这股力量赋予给强大的技术平台,可能会让人的一切行为无所遁迹。

数据挖掘:数据—>信息—>知识。简单的汇聚来自各种平台的数据,并不会带来任何价值,只有经过数据分析与挖掘,展示各种数据的关系才能揭示背后的秘密,增长人类的知识财富。

数据可视化:Data Visualization是近年来的一个热点话题。在这个读图时代,如何将错综复杂的数据用直观形象的方式展示给用户,揭露数据背后的秘密,直观展示数据的商业价值与趋势,无论是政府、商业机构还是个人,都有这类需求。这也是一门综合的学科,需要融合艺术与技术两个领域的知识,需要高端复合人才,国内在数据可视化领域的研究还没有成熟成果。

政府公开所掌握的数据,可让公众监督并参与政策的制定与执行。商业公司借助大数据平台研究未来的盈利点。这一切美好的愿景,不仅需要技术支持,还需要政策引导和规范,更需要每个人对数据分享、使用持有自己的立场。

Google在互联网数据抓取及管理分析上都具有无与伦比的能力,而真正的大数据不仅仅是互联网网站数据,更应该是人与人的数据,人与物的数据。现实生活中,各个机构、商家都留存用户的信息、购物记录、产权信息等,如何将这些数据关联共建,如何将人与人的真实关系、每个人的每日生活信息,都关联起来,才是真正大数据平台。

未来谁掌握了大数据平台,谁就是主宰者。这是一个最好的平台,这是一个最坏的平台。

Author:xialeban | Categories:挨踢江湖 | Tags:

2条评论

  1. ixwebhosting说道:

    内容总结的好详细,值得的欣赏

发表评论