大选前,各大阵营和各路英雄豪杰,除了使出浑身解数,通过各大社交媒体平台大展拳脚之外,各大阵营,尤其是即将上阵的人选,无不想起了互联网和资讯工艺的最强势力:大数据!他们希望能通过大数据分析,侦查“战况”,甚至还希望有大数据分析报告,帮他们赢得天下。
谷歌确实有提供 Google Trends 搜寻趋势分析报告。谷歌的搜寻趋势排行榜,是根据用户登录谷歌 Chrome 浏览器,或网民利用谷歌搜寻服务的大数据分析所得。谷歌曾经发文表示,Google Trends 利用搜寻趋势的大数据分析,可以更准确的预测流感病发灾情和传染灾区范围。
事实上,并非所有网民都会登录和使用谷歌各种服务,就算是利用谷歌搜寻服务搜寻特定字眼/关键字,也不代表网民对那些搜寻关键字有特别倾向或喜好甚至认同。网民或许只不过要搜寻有关关键字的资料、内容、讯息罢了。换言之,如果我用谷歌搜寻“苹果”,并不表示我喜欢吃苹果或我支持苹果或者我排斥苹果,也许我只是想看看苹果是怎样的水果罢了,又或许,我想搜寻的是苹果产品⋯⋯
大数据即使加上人工智能,也不太可能精准的演算出大选实况,其中关键:每5年一次的大选投票并不像网购般属于日常生活习惯,可以让人工智能日积月累的收集大数据来分析网民的网购习惯、喜好和倾向。还有一个重点,网民并不等同于合格选民;合格选民也不一定是网民,并非所有合格选民都会上网。就当作全部选民都是网民,还没划下一个X投下手中的一票,也无法准确的反映实况,更何况投票是秘密进行的。大家别忘了上次的美国总统选举,利用传统民意调查探测“战况”的各大传统媒体、评论家、时事评论员,都纷纷大跌眼镜。
难道大数据没有用? 3月底,中国就发生了大数据“杀熟”事件。所谓的“大数据杀熟”,是指商家利用用户大数据,对老客户和忠实常客,实行价格歧视行为,在机票、酒店、电商、出行、网约召车等价格波动平台上,显示给老客户和忠实常客更高的价格,反而让新客户获得更便宜的价格。这种“不熟不吃,越熟越杀”的价格歧视行为,隐藏了各种因素,在此撇开不谈。然而,这事件却带出了大数据是否“中性”的问题。以搜寻热门关键字排行榜为例,如果雇用成千上万的网民(网络水军),同时上网用同一搜寻引擎搜寻同一关键字,搜寻趋势排行榜的结果,必然可想而知。刷榜、刷单等,在某些国家已经是一门大生意了。如果没有采用公平、公正、透明的机制,民意调查大概也可以随意操控。顾名思义,大数据就是要有大量的数据,才可分析出非常大可能的结果。瞬息万变且5年一次的大选,算不算是大数据?
(图源:互联网公共领域图+DIY)