【最精确的“间谍”,最冰冷的“朋友”】 查找朋友下载

  早在20世纪80年代,美国就有人提出“大数据”的概念。20多年来,这个名词变得越来越流行,越来越重要,最后成为国家和政府层面的发展战略。  尿布和啤酒搭卖背后的奥秘
  “大数据”之大,不仅在于容量,更多意义在于:人类可以分析和使用的数据大增,通过这些数据的交换、整合和分析,个人在真实世界的活动得到前所未有的记录,新的知识与价值被不断发现与创造。
  沃尔玛是全世界最大的零售商,拥有8400多家分店、200多万名雇员,以及全球数一数二的数据仓库,是最早应用数据挖掘技术的企业之一,也是数据挖掘技术的集大成者。在一次例行的数据分析之后,研究人员发现:跟尿布一起搭配购买最多的竟是啤酒!因为许多年轻爸爸经常到超市买尿布,他们中的30%~40%会顺便买点啤酒犒劳自己。沃尔玛随后对啤酒和尿布进行了捆绑销售,不出意料,销售量双双增加。
  美国某地区新安装的一部ATM提款机数据记录出现异常:每天午夜12点到凌晨2点之间,大量款项被提取。银行担心这涉及诈骗等违规操作,于是展开监控和调查。结果是:提款机旁边是一家色情俱乐部。顾客深夜取现,本来不想在信用卡上留下“不体面”的消费记录,却仍然被“数据”暴露无遗。
  显然,“大数据”既能量化一个群体的行为,也能透露个人隐私。
  密歇根州一些警察就曾利用警务数据库“猎艳”。他们在街上邂逅漂亮女士,记下她们的车牌号码,通过查询数据库,获得其住址等个人信息。2001年前后5年间,涉嫌滥用警务数据库的警察共有90名之多。特拉华州还有政府官员将公民个人信息泄露、出卖给赌博公司,帮助他们追债,开发新顾客。
  事实上,关于“大数据”利与弊的辩论,美国各界的讨论从来没有间断,形成泾渭分明的两派。
  上世纪60年代,人类计算模式还处在主机时代时,白宫预算局(现更名为行政管理预算局)就提议联邦政府成立“数据中心”,把政府部门所有数据库连接、集中、整合起来,建立一个大型数据库——“中央数据银行”。
  支持者认为,现代经济依赖大规模的数据整合和交换。统一集成的中央数据库将提高经济效率,方便大众生活,是现代社会发展的必然,也是社会进步的不二选择。
  反对者则是隐私至上的信奉者。他们认为,在信息时代,无论个人日常琐事,还是事关健康、教育的重大决策,都会在各种信息系统中留下“数据脚印”。其保存在不同系统中可能无伤大雅,但如果建立起中央数据银行,通过数据整合和信息加总,就可以再现一个人生活的轨迹和全景,各个系统之间的数据彼此印证,互相解释,个人隐私就无所遁形。这将形成一种“数据监控”,无异于《一九八四》中的电幕。甚至有人控诉:大数据就是“老大哥”!
  大数据监督白宫
  尽管如此,作为开放政府的主要举措,美国Data.Gov这艘“旗舰”起航之后,公共数据的无偿共享将数据开放的概念诠释得淋漓尽致,新闻舆论也给予了空前一致的好评。
  如何避免买到具有安全隐患和质量问题的商品,无疑是所有消费者最关心的话题,在美国也不例外。特别是婴幼儿的食品和用品,如果有质量问题,往往成为父母亲的梦魇。
  Data.Gov上线后,各种因为质量问题而被召回的商品记录立即成为最受欢迎的数据之一。
  联邦政府共有农业部、食品药品监督局、消费者委员会等6个部门涉及商品质量和产品召回的管理工作。早期,这6个部门在各自网页上公开其管辖范围之内的问题商品的召回记录。
  2009年,为了方便用户查询,联邦政府内务部决定:在整合这些数据的基础上,开设一个专门的商品召回查询网站。在这个网站上,消费者可以对任何商品进行查询,获得其是否具有被召回的记录,也可以对某一种商品进行跟踪,获得电子邮件的提示信息。
  这个系统还可以在智能手机上使用。消费者在购物时,通过在随身携带的智能手机上键入产品的名称及型号,就可以在购买时直接查看该商品是否具有质量问题和被召回的历史记录。如果消费者怀疑该商品存在问题或者是被召回产品的漏网之鱼,还可以立即在线举报。眼下,这个系统同时在Android和iOS上都有应用,受到消费者莫大欢迎。
  Data.Gov的每一步推进,都获得了阵阵掌声。开放数据的政府机构越来越多,数据越来越透明,甚至包括白宫。华盛顿责任道德公民中心(CREW)是一个位于华盛顿的公益组织。它致力于通过法律行动监督政府官员,防止公职人员为了特殊集团的利益而牺牲公共利益。
  在2009年奥巴马的医改方案引起激烈争论与质疑时,CREW创始人梅拉尼?斯隆提出,奥巴马应自证清白,公布自己在上任之后,与医疗保险行业的董事长、经理人以及相关说客在白宫的会面次数、时间长短和会议议题等记录。
  呼吁继续“得寸进尺”:人民有权知道,总统每天在和谁见面,谁在访问总统,谁在访问白宫,谁在影响政策的制定。
  当白宫开放部分数据后,阳光基金会主任米勒仍不满意,他说,白宫公开数据的周期应该缩短到一天,每天都应该发布前一天的访客记录。
  此外,阳光基金会还组织技术人员,把白宫发布的数据记录和其他数据库进行增值整合。将到访人员的姓名、白宫访问记录和游说人员的捐款数据库、知名人物社会关系数据库,与维基、谷歌搜索连接整合起来,让所有游说人员到访白宫的次数、捐款的多少以及各类社会关系等相关信息都在一个页面中一览无余。
  2010年4月,有人利用这些数据在Data.Gov上开发了一个新的查询工具:白宫访客搜索。借助这个工具,不仅可以按访问人、被访问人对原始数据进行查询,还能利用语义网的技术,把相关人员的数据与其他网站连接起来。
  另一家公益组织“司法监督”的主任进一步主张,除了因公访问,因私访问总统和副总统的记录,也应该公开发布。
  2011年4月,“白宫访客记录”又引发了新一轮批评。公共廉政中心是一家致力于推进政府透明的新闻调查机构,该机构在研究了白宫从2009年9月到2011年4月公布的100多万条数据记录之后,得出了以下结论:
  一、有人去了白宫,但白宫公布的数据当中却没有相应的记录;
  二、白宫办公厅主任的受访记录仅有500余次,但他的3个助手却共有4000次;
  三、有20.5万个记录的时间描述是空白的,其中,很多都是和总统及其高级助手召开的小型会议,会议目的是什么,无从得知。
  白宫发言人对此做了回应:当初开发设计“白宫访客记录”系统,是为了维持白宫秩序,保护总统和副总统的安全,而不是政治监督。
  这个回答,确实也道出了问题的关键和白宫的苦衷。
  但有理由相信,美国白宫不久后将会安装上一套适合政治监督的访客信息管理系统。因为,历史的发展从来都是这样——执着的公民改变世界。而“大数据”,也远不仅仅是一个技术命题。
  摘自《大数据》,徐子沛著,广西师范大学出版社2012年7月版

推荐访问:间谍 精确 冰冷 朋友