对话哈佛教授:五毛党发帖意在“转移焦点”

所谓的“五毛党”在网络上发帖宣传中共似乎是公开秘密

近日,哈佛大学政治学系校级教授加里·金(Gary King)的团队 发表的一篇研究报告指出,中国社交媒体充斥了所谓“五毛”的评论,中共当局试图以此影响公共舆论。

加里·金的团队(以下简称金团队)估算,“五毛党”每年在社交媒体上发布的信息约有4.88亿条。这些信息集中发布在两会、中央全会、烈士纪念日、新疆暴乱等新闻时期。不过,帖子内容往往与新闻事件无关,而是肯定政府成就、宣传国家历史。

“政府人员”

金团队研究了从江西赣州章贡区网宣部门泄露的2341封电子邮件,同时从中确认了近4.4万条五毛党发布的消息。

该团队发现,这些电子邮件的内容主要是政府部门给五毛党分配的任务或是五毛党的工作汇报。信息发布者也几乎全是政府工作人员,而非低价雇佣的编外人士。

调查以章贡区的发帖量为基础,金团队据此估算,五毛党每年在社交媒体上的发帖量约有4.88亿条。

在能找到链接的帖子中,53%发布在政府网站上,46.67%发布在新浪微博、腾讯微博和百度贴吧等社交媒体和商业网站上。

报告也指出,五毛党往往不会回应民众具体而单一的抱怨,但会在可能催生集体行动的事件发生时集中发帖。这一结论与金团队之前关于网络审查的论文相呼应。

哈佛教授

Gary King是哈佛大学的校级教授(University Professor),全哈佛仅有24名教授享有这一荣誉。其中,Gary King是阿尔伯特·J·韦瑟黑德三世校级教授。

Gary King以实证研究知名,擅长量化研究,其研究对政治学、公共政策、法学、心理学、统计学等领域都影响深远。

近 几年,Gary King开始关注信息控制,2013年同一团队曾发表论文《中国网络审查制度如何允许批评政府却禁止群体煽动》(How Censorship in China Allows Government Criticism but Silences Collective Expression)。金团队另外两名成员为Gary King的博士生潘婕(Jennifer Pan)和玛格丽特·罗伯茨(Margaret Roberts)。

那么,Gary King为什么要做这一调查呢?其研究是否合理呢?他又从中观察到什么呢?

以下是与Gary King的问答对话:

问:你们为什么想要做这个研究?什么时候开始的?

答:这就是社会科学家要研究的话题。2010年左右,我们开始研究信息控制,研究范围涵盖中国等多个国家。

最开始我们想要做的是用大数据做自动化文本分析(automated text analysis),我们三人都没想过要研究审查或是“五毛党”。

那个时候,我们实际是在研究一套统计方法。当时我们使用了这一套方法,但是我们觉得有必要对其进行压力测试。因此我们被迫中断了一段时间,尝试着去改进这套方法,最后我们也成功了。而为了进一步强化这套方法,我们决定转换语言。

中文和英文十分不同,潘婕和Margaret也恰好说中文,因此我们决定用 中文做进一步的压力测试。紧接着,我们从Crimson Hexagon上下载了中文社交媒体的数据库。Crimson Hexagon这个公司是我创办的,它能够挖掘并且收集世界各国的社交媒体信息。后来证明,即使是中文,这套方法也运行有效。

后来我突然想 到,为什么我们不回到帖子所在的网站上,去了解这些帖子的上下文。因为要做定性研究,我们通常会希望了解文本所处的特定情境。结果我们发 现,Crimson Hexagon挖掘的数据存在问题。部分链接能够指向原来的网页,而另外一些帖子却打不开了。最后,当我们打开某一个链接时,网页显示这个帖子已经被查 了。

那个时候我们意识到,我们可以在政府审查这些帖子之前将其下载下来。于是我们又开始着手做自动化文本分析,开始研究审查。这次有关五毛党的报告也是前面研究的后续。

问:你们是怎么估算出每年五毛党的发帖量高达4.88亿的?章贡区的样本是否具有代表性?地区差异如何处理?

答:我们的研究样本是从江西赣州章贡区网宣部泄露的邮件及相关的帖子。这些资料早就发布在网上了,人们也在讨论,也在抱怨,但没有人研究过。

于是我们对其进行了系统研究。我们发现在一年内,章贡区五毛党的发帖量超过43000,而章贡区仅仅是中国2862个县级行政单位之一。

接着,我们探索出一套可以估算全中国五毛党年均发帖量的方法。在小县城,网络覆盖面较低,我们认为那里的五毛党发帖量不会比章贡区更多。而在人口更多、面积更大的城市,互联网普及率更高,政府更为活跃,我们认为那里的五毛党发帖量会比章贡区多。

同时,我们也考虑了章贡区五毛党发帖的模式,比如是哪些人在发帖?是哪些账号在发帖?这些账号有多少粉丝?政府结构是怎样的?在其他地区,我们也尝试着寻找同样的模式。综合考虑这些因素,我们才系统演算出一个五毛党的年均发帖量。这个数字确实挺大的。

当然,我们确实可能会忽略很多因素。在我们将章贡区推至全国时,我们考虑了尽可能多的因素。不过不幸的是,我们只有章贡区的样本,样本量确实很小。

问:做这个研究的过程中,您觉得最有趣或是最出乎意料的部分是什么?

答:我觉得研究的主要发现就挺有趣的。当我们最开始做的时候,我们觉得五毛党发帖是为了反驳批判政府的言论。不只是我们,记者、学者、社会活动人士、社交媒体参与者等四个群体都持有相同的看法。

当我们发现五毛党发帖的主要内容是宣传政府,而他们的目的是为了转移公众注意力的时候,我们都特别惊讶。这确实是个非常聪明的策略。我觉得之前应该没有人这么想过。

问:转移公众注意力的策略有效吗?你们有研究过互联网用户对这些帖子的反应吗?

答:我们并不是清楚地知道这个策略是否有效。不过一些社会心理学实验已经证明,在其他背景下,转移注意力的策略十分有效。

当你跟家人朋友吵架的时候,最坏的策略往往是最有力地反驳对方,而最好的策略往往是跟对方说:“嘿,要不我们去吃个甜点吧。” 不少社会心理学家已证明过这套策略是如何生效的。

在特定情境下,针对社交媒体的某一特定策略是否生效是一个更进一步的问题。我觉得这个策略多多少少会对受众起到作用。因为人的注意力是有限的,你不可能同时关注所有事情。

如果同时爆发多起完全不同的事件,我们有限的注意力就会被分散。要说整体上这个策略有多有效,我还不知道。那些批判政府的人,他们可能会意识到这个问题,甚至可能会做出反应。不过目前我们都不能知道确切的情况。

问:在你们的研究中,哪些话题是五毛党努力转移的?

答:我们认为可能催生集体行动的话题会被转移。在我们的样本中,五毛党清楚地称他们想要避免“紧急事件”,而这些紧急事件基本上都是集体行动。

问:哪些行为可能催生群体性事件?

答:我们在网络审查的论文中对此下过定义,主要包括三类行为:一是线下正在发生的游行示威等群体行动;二是跟过去组织过或是煽动过集体性行动的人相关;三是跟民族主义或是民族主义情绪相关,且这些情绪曾煽动过游行示威等群体行为。

在审查过程中,当某个话题变成热门话题的时候,网上会在短时间内涌现出大量针对这一话题的讨论,那就可能催生群体行动。如果这些讨论跟某一具体事件相关,且属于上述三种分类的一种,那么网络上的讨论就会被审查。

问:报告中,你们称五毛党能容忍民众具体的抱怨,但是不能容忍可能催生群体事件的行为?这两者你们是怎么区分的?抱怨也可能会导致集体行为。

答:我认为它们是不同的。因为在几乎每一个国家,民众对政府都有所抱怨,比如公共政策实施不到位、不喜欢某些领导、不喜欢政府政策等等。在一个复杂的国家,会有各种各样让人感到失望的事情。

我 认为可能催生群体事件的行为往往跟到那些有能力把民众聚集起来的人有关。这些人确实需要民众的抱怨,需要一个载体把群体煽动起来,但是社交网络并不缺少抱 怨。至少得有数千人站出来,说他们需要改变。但是单一而具体的抱怨不太可能催生群体行动,也不可能改变任何事情。因此我认为这两者是完全不同的。

问:除了政府工作人员,还有哪些人是五毛党?你们的报告里面称,五毛党的背景各不相同,那这些人的背景是什么?

答: 这是之前别人所传的谣言,我们不知道是不是真的。在我们的样本里面,我们没有发现任何人不是政府工作人员。当然,这只是我们的样本量所呈现的。或许会有外 来雇佣人员,只是我们没有发现,问题是证据在哪儿?想一想,如果你和我管理五毛党发帖的事情,而我们可以雇佣任何我们想雇佣的人。我们现在是政府官员,我 们手里已经有很多人跟我们干活了。你会怎么做?

这跟删帖者的任务是不一样的。删帖者每天一早上班,他们读帖子,然后决定把哪些帖子删掉。他们每天都做这件事情,循环往复。

五毛党就不一样了。他们只有在某些特定事件爆发时才需要发帖。平时的多数时间里他们都不需要干活,少数日子里他们才会有大量工作。要找到这样的员工并不容易。所以,直接找那些有其他工作的人就显得顺理成章了。

问:您的报告中说,53%的五毛党帖子发布在政府网站上。《环球时报》的一篇文中称,是你们“混淆了官方权威信息、官方媒体消息以及普通网上发言之间的区别”。对此你怎么看?

答: 我们研究的帖子确实都是五毛党发的。在我们的研究样本中,有大批量突然涌现出来的帖子,且这些发帖者互相没有关系,他们不回复,也不互相评论。可以认为, 他们是被协调安排的。那这些协调安排指令是谁发的?只可能是政府。就章贡区而言,我们可以看到这些指令的确是政府下发的。

问:《环球时报》的文中还称,“中国的政治体制与西方不同,舆论生态自然也不会一样”,你怎么看?

答: 这并不是很夸张的评论。每个国家的政府都希望引导舆论,只是方式不同。在西方,政府会就某些话题公开发表言论,也会跟公众进行讨论,借此影响舆论。而在我 们的研究中,政府是通过秘密的行动来影响舆论。他们试图让民众相信,这些帖子是由普通民众写的,而不是政府工作人员。

问:做这个研究的过程中,您觉得最难的部分是什么?

答:有两个部分比较难。第一个难点是,确实有太多的工作要做,有太多的数据要处理。当然,这是我们需要做的,不是什么大事。另一个难点是我们观察这些数据的角度。

当你从某个角度观察的时候,你没有任何发现。你在试着找出证据证实自己的想法,试着去找五毛党跟别人争论的证据。

然后你去观察这个数据,但它就像个狡猾的耗子一样。然后我们就想到,或许五毛党是为了转移公众注意力呢?当我们从这个角度去观察数据的时候,它就和我们的发 现非常吻合了。这部分工作很难,是因为你不知道自己什么时候能够想到答案。你一直在试,但是数据一直在说不,直到你想到跟数据吻合的答案。