何清涟:修改数据后的选情民调只能误己


    美国2016年总统大选

    美国2016年总统大选

    美国2016年总统大选落幕,除了全世界掉眼镜之外,还比往年多了一些余兴节目,其中最重要的一幕就是媒体与民调受到的质疑及他们的自省。

    这场质疑游戏刚开始

    应该说,美国媒体还没打算自我检讨,但来自外部检讨却开始了。按日期来排,这场质疑游戏的开始来自于中国那些加入了预测队伍的专家的检讨,比如《美国大选结果,我们为什么预测错了?》 ,文中检讨了三大原因:精英意识的缺陷、媒体和民调的误导、 价值倾向在现实的映射。美国媒体对2016年大选报道的反思,最早始于11月10日MSNBC《早安,乔》节目,针对当天《纽约时报》头版头条文章发出抗议,反思美国主流媒体在本次大选报道中的偏颇与不公。主持人乔·斯卡伯勒指出,记者的责任,不是报道他们的偏见,而是深入民众,了解他们的想法,了解国情,报道人民。次日,《纽约时报》文章也开始帮助别的媒体进行反思:《预测希拉里获胜的美国媒体,你们错哪儿了?》

    关于美国媒体在大选中站队的现象,我称之为“媒体失职”,早已写过好几篇文章,例如《2016美国大选看媒体失职》、《世界共同的焦虑:受众对媒体的信任弱化》等,指出被世界媒体业视为业界典范的西方媒体,在美国大选年,陷入“政治正确”的意识形态陷阱而导致媒体失灵,虽然有少数媒体业者意识到这一问题,但却未必能从这陷阱中走出来。它们的表现让人失望,忘记了自身的“社会瞭望者”职责,远离民意,不仅妨碍了其客观公正性,使这场大选陷入毫无意义的口水战,还使民众远离传统媒体,选择从替代媒体获取信息,将社交媒体作为自己的言论平台。

    对媒体的批评早在事前发出,因此,本文只想谈对民调失真的分析。

    民调如何才能反映真实民意?

    凡做过民调或者市场调查的人,都知道民意调查涉及到问题的设计、样本的选择、抽样的数量、如何解释误差等等。问题设计的不同,往往结果也不同。在不同问题的暗示诱导下,答案自然不同。此次辩论的问题很简单,就是你支持谁,为什么支持某位候选人。民调要想真实反应民意或者市场,第一是设计问卷要客观公正,第二是调查样本的均衡,第三是不能根据需要修改数据。

    但今年的民调,恰好在这三个基本原则上都出了问题。一是问题的设置明显有倾向性,比如接受某项民调的调查时,在问受调者支持哪一位之后,接下来的问题就是:你支持川普是因为他是:1、白人种族主义者;2、富人;3、他对对手的攻击显得他力量很强大?对希拉里则问的是:1、她关心穷人与底层;2、关心人权;3、她有丰富的从政经验。说老实话,这种调查问题的设计完全破坏了民调应有的客观立场,至少在列举一位候选人的缺陷之时,应该对等地列举另一位的缺陷,决无这种一方只列缺陷另一方则只列优点(比如忽视希拉里的电邮门、克林顿基金会等)。

    第二是调查样本的均衡与代表性受到破坏。今年10初,路透社对一次民调样本的“微调”被网友揭发,形容为“用尽方法狡猾地调整问题和类别,以动摇受访者的偏好方向”。揭发的网友称,路透社通过改变民调样本,将不成比例数量的民主党人纳入民调对象之中,从而达到公然更改民调的目的。大致情况是:在最新一次民调中,路透社指出,希拉里领先6个百分点。但是,当深入挖掘,就发现路透社的民调对象包括了44%的民主党人以及仅33%的共和党人。当然,如果采用这样的比例有任何事实依据的话,这也并无不妥。然而,美国皮尤研究中心明确指出,注册的民主党人仅代表大约33%的选民,而共和党人则代表29%,这4个百分点的差距在路透社的民调样本中居然被拉大到11个百分点。网友指出,如果改变样本数据以反映美国皮尤研究中心所说的民主党人和共和党人的真实占比情况——33%和29%,那么结果是川普的支持率还要比路透社公布的多8.5个百分点,也就是他将比希拉里高2.5个百分点。

    10月22日,统计学家泰勒·德顿(Tyler Durden)就美国大选民调发出警告,要美国人忽视那些变化无常的民调(Statistician Warns Americans To “Ignore The Capricious Polls”)。这篇文章的分析太过专业,这里简译主要结论,这位统计学家认为应该忽视本次大选民调的理由是:抽样调查的统计误差区间越出统计学理论或者概率论可以做科学解释的正常覆盖范围,数据可能有假。

    除了以上三个因素之外,还有一个因素使得民调出现偏差,这就是美国媒体对希拉里一边倒的偏爱,导致对川普的污名化以及对川普支持者的污名化,比如,美国主流媒体一致认为,支持川普的人主要是受教育程度不高的白人男性,收入低,多是失败者,等等。为了避免麻烦,川普支持者大多拒绝接受调查,一般情况下也不会公开表态,这就是今年媒体公认出现“隐形川普支持者”的情况,对这部分人占比多少,媒体与民调显然估计不足。他们忽视了民调中一个基本常识:如果调查问卷中的问题明显对受调者支持的候选人不利,选民就不大可能会回答一些与候选人相关的问题,即使是匿名接受调查。对这一现象,哥伦比亚大学统计学教授安德鲁·戈尔曼(Andrew Gellman)和微软经济学家大卫·罗斯柴尔德(David Rothschild)曾做过详细解释。

    大选尘埃落定的各种反应

    美国大选结果出来后,有人称这是民调分析的“末日”。几位为美国大选做民调整合分析的人,包括一些大名鼎鼎的“预测大师”,这次算是全军覆没,其中“普林斯顿选举联盟”的王声宏(Sam Wang)因为事先声称川普连百分之一的机会也没有,甚至发誓:“选举已经完了。如果川普赢得超过240张选举人票,我会吃虫子。”11月12日,王声宏在CNN节目上表演吃虫子,以示信守承诺—— 一位青年科技才俊,竟然与远在中国的五毛领班周小平表演了同一出守信之戏,只是周小平吃的是土,而不是虫子,那土据网友揭发是巧克力粉。

    在本次大选中一直力挺希拉里女士的《纽约时报》做了一件有趣的事情,在大选的当天公布了一份2016年大选民调(Election 2016: Exit Polls),几乎否定了该报以前发表的评论者对川普支持者收入、种族、受教育程度、性别的想当然的分析。仅以收入一项而言,川普支持者的收入普遍高于希拉里支持者。该调查将收入划分为6档:年收入3万以下者,希拉里支持者占比53%,川普为41%;3万-5万者,支持希拉里的为51%, 支持川普的为42%;5-10万的,希拉里支持者占比46%,川普支持者占比为50%;在10-20万、20-25万、25万以上收入者中,支持川普的都比支持希拉里高1-2个百分点。

    据《纽约邮报》11月11日报道《纽约时报:我们给川普唱了反调》(New York Times: We blew it on Trump)称,读者们纷纷停止订阅《纽约时报》,该报发行人阿瑟·小萨尔茨伯格(Arthur Sulzberger Jr)在致该报订户的信中,一方面坚持说,他的记者公正地对两位候选人作了报导,但同时不得不发誓说,这份报纸会“重新献身于纽约时报新闻主义的基本使命”。《纽约邮报》在这篇署名文章中指出,假如当初做得不错,它今天又何必要“重新献身于”诚实报导呢?但是,背离新闻主义这一指责并未抓住《纽约时报》的全部错误,因为该报在大选前的编辑方针完全抛弃了过去几十年新闻界所建立的采编标准,那就是,为了赢得公众的信任,媒体报导必须公正。

    今后,美国媒体与民调机构要记住一点,民调不是宣传,民调机构的候选人也会参考这些民调数据,他们的竞选团队也会根据这些数据来调整自己的竞选策略。因此,民调的作假,固然可以让竞选者充满自信,但也会在某种程度上为竞选人带来严重的损害。希拉里阵营如果要总结经验教训,在批评FBI带来的损害的同时,也应该给民调机构记上一笔账。