本文作者比尔·弗兰克斯是Teradata的首席分析官,同时也是international Institute for Analytics的教员。他表达了有关大数据空间及其分析的发展趋势的见解,著有The Big Data Tidal Wave,并在最近出版了他的第二本书The Analytics Revolution。

窥探人隐私的不是数据,是人。但是这样简单的事实,人们往往很难接受。就像NSA(国家安全局)发生的丑闻,经常性的数据泄露事件和频发的电视台窃听私人通 话事件,难怪人们会越来越不信任数据。91%的美国人认为,消费者已经无法阻止个人信息被其他企业收集和利用,并有61%的人希望能采取措施保护他们在网 上的个人信息。无论数据是被社交媒体故意披露的,或是通过人们在网站和智能手机上留下的痕迹无意中收集的,恐怖的是,个人隐私和信息自由,甚至是民主意识 都受到了威胁。

从法院受理的官司和媒体讨论的骇人设想可以轻松得出结论,大数据分析总是有害的。但是,真的是这样的吗?

利大于弊

最近,我出席了一个会议,与众多国家立法者和高管商讨如何能利用大数据、更先进的分析技术以及升级数据管理系统,从而帮助国家更有效地控制成本,减少欺诈行 为并提供更高效的服务,更复杂的分析和更新的数据管理平台,提供国家服务。会上提出了隐私泄露和数据误用的问题,并引发了激烈的讨论。讨论的主题是:鉴于 当权者误用和滥用数据的风险,国家收集大量数据到底是不是个好主意。

我给出了几个强大数据如何能为人们带来很多好处的例子。想想那些指派去 监控那些有虐童史家庭的社会工作者,如果新来的社工能使用过去搜集的数据,孩子们就可以结束不必要的受伤,甚至死亡。在我的家乡格鲁吉亚,因为社工没有有 关孩子当时面临的危险的重要信息,很多孩子因此丧失了生命。这一事件在当地引起很多关注。

某国家官员指出,获得的关注有效度与这些国家工作 者收集的高度敏感信息有关。使信息容易获得意味着低收入、技术水平不高的工人可以轻松获得高度隐私和敏感的信息。这样的信息显然更容易会被滥用。但是,在 这种情况下,比起被滥用可能造成的后果,这些信息对保护孩子的生命带来的好处更大。更重要的是,这些能轻松访问数据的人都很清楚,如果他们滥用数据,不但 会丢了自己的工作,还会受到很严重的法律制裁(反抗一次你就没机会再继续工作了)。

这有点像驾驶。每次我们开车其实都是冒着生命危险的。在 任何时候,都有可能会有人朝我们撞过来撞死我们,即使我们可能什么都没做错。发生这样的事情确实很可悲,但它发生的几率太小了,以至于我们都可以接受这种 风险。而从中我们获取了许多好处,我们能自由去任何地方,其好处足以弥补可能发生的风险。没有人会为了阻止每年发生的大量完全可以避免的车祸夺命案而去建 议禁止汽车上路。整个社会已经达成共识,相比造成的风险,开车带来的好处多太多了。

我们在审视大数据及其分析时也应采纳同样的方法。利用大 数据带来的好处无疑是是巨大的,无论我们如何小心,然而,同样的数据有时可能会被滥用。我们要做的应该是尽量减少数据滥用的发生,让处罚严重到人们因怕惩 罚而不敢去尝试。如果州政府和其他组织能够发挥利用大数据的积极的部分,社会整体会变得越来越好。