网络高科技公司通过分析大量用户行为数据,可以精准判断用户的喜好乃至性格。然而在享受高度个性化服务的同时,不知不觉间我们也暴露了大量个人隐私。要便利还是要隐私?这真的是一个问题。
十年前,美国《纽约客》杂志封面文章曾经说,没人知道电脑前面打字的是一条狗;然而如今,就算是一只狗在玩电脑,也会有人知道你在网络上都干了些什么。“嘿,别转头,说的就是你。”哈佛大学的社会学教授加里·金说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。”我们已经迎来了一个“大数据”时代。
大数据到底有多大?
什么是大数据?羊城晚报记者从维基百科上看到,所谓的“大数据”(big data)指的是:”网络公司日常运营所生成和积累用户网络行为数据增长如此之快,以至于难以使用现有的数据库管理工具来驾驭,困难存在于数据的获取,存储,搜索,共享,分析和可视化等方面。”
由于这些数据量是如此之大,已经不是以我们所熟知的多少G(1G=1千兆,即2的30次方字节)和T(即1千G)为单位来衡量,而是以P(1千T),E(1百万T)或Z(10亿T)为计量单位。
百度对此给予了更形象的描述。光是其新首页导航每天就要从超过1.5PB的数据中进行挖掘,这些数据如果打印出来将超过5千亿张A4纸。全部摞起来超过4万公里高,接近地球同步卫星轨道,平铺可以铺满海南岛。而2020年新增的数字信息成长幅度将是2009年的近45倍。如今,只需两天就能创造出自文明诞生以来到2003年所产生的数据总量。(林曦)
喜怒哀乐皆为商机
事实上,华尔街有炒家利用电脑程序分析全球3.4亿微博账户的留言来判断民众情绪,再以1到50为其打分。同时根据打分的结果,来处理手中数以百万美元的股票。判断原则很简单:如果多数人表现兴奋,那就买入;如果大家的焦虑情绪上升,那就抛售。这一数据分析帮助该炒手今年第一季度获得了7%的收益率。
“有多少人访问你的网站,他们呆了多长时间,这些数据对任何企业来说都至关重要。”京东商城副总裁李曦告诉羊城晚报记者表示,人以类聚物以群分,购物时朋友的选择或推荐比专家观点更为可信,而数据驱动可以为用户提供最接近的匹配结果。“电商搜索引擎可以明显地透露用户的购买意图,这是巨大商机。”
图片来源于羊城晚报
羊城晚报记者了解到,在百度有一个“奇思妙想实验室”,在足够规模的用户数据和技术积累下,输入一句简单的“怎么向女友求婚”,通过“跨领域推荐”引擎技术,便能找到一套为你量身打造的方案。甚至连道具、路线、天气,乃至如何讨得她家小狗欢心的方法都考虑得一应俱全。
(责任编辑:)