官网    |     主页

刘珂:算法推荐的潜在风险

作者:来源:经济与社会研究院发布时间:2021-09-18

作者:刘珂(暨南大学经济与社会研究院助理教授)

人们很少能静下心来就某一个话题去搜索相关信息。大多数时候,我们只是拿起手机或者打开新的窗口,找到一个我们经常访问的网站或者APP,然后点击那些我们认为有趣的标题和朋友分享的链接,可能还会留下一句评论。我们可能并不准备得到任何有用的信息或知识,而只是想在排队、等车、健身或者失眠时寻求一些娱乐。然而,我们往往对于在网上看到的内容如何决定以及怎样影响我们的认知并不了解或不感兴趣。

近年来,人工智能的发展让算法推荐强势崛起,成为当下最流行的内容分发方式。所谓的算法推荐,指的是互联网产品基于每个人的浏览历史、年龄、性别、地理位置等数据对将要浏览的内容做出个性化的选择。从新闻报道的角度,算法选择的结果往往都是支持我们已有观点的文章或推送,因为人们一般更喜欢浏览也更容易理解这类内容。在社交媒体上,算法也会给我们推荐和我们兴趣或立场相似的群组。这听起来可能并非什么坏事,但由于反复接受相同的观点,我们容易变得偏执并走向极化,就如同置身于信息的“回音室”之中。久而久之,我们会假设所有人都和我们的想法一致,忽略了与我们的自我认知相冲突的观点,从而偏离了事实真相。

随着“算法为王”的价值观念被媒体广泛接受,对算法推荐的监管也迫在眉睫。8月3日,国家五部门发文要求开展对算法推荐的综合治理,算法推荐一时间成了众矢之的。为了有效制定相关的监管政策,我们首先需要理解算法推荐对媒体行业竞争和消费者认知的影响以及背后的经济学逻辑。

算法推荐与媒体行业

媒体行业的竞争不同于传统意义上的产品市场的竞争,媒体的数量也不简单等同于市场上的厂商数量。媒体不仅可以通过降低价格来吸引消费者,还可以通过其报道的信息来影响消费者的认知,从而影响消费者对于其他媒体的消费意愿。例如,假设某家媒体报道了吸引消费者眼球的虚假新闻,当消费者从其他媒体了解到更接近事实真相的报道以及相关证据时,理性的消费者未来会选择避开报道假新闻的媒体从而提高信息的准确性。因此,即使是规模较小的媒体也有能力通过信息的传播对那些媒体巨头的市场需求产生深远影响,这也意味着传统意义上以市场份额为基础的市场集中度指标不完全适用于研究媒体行业。

算法推荐主要影响媒体行业的需求而非供给。换言之,算法推荐主要影响如何将媒体提供的内容和消费者进行匹配,而不是媒体如何提供这些内容。媒体市场上可供人们选择的内容数量众多,且质量参差不齐。这是由于媒体生产内容的边际成本较低,且不同消费者在不同时期的偏好不尽相同。更重要的是,新闻报道、社交媒体的发布、歌曲和电影等商品对于消费者而言属于“经验品”(experience goods),即这些内容的质量以及是否满足消费者的需求只有在消费者消费以后才能确定。因此,不论是通过人工编辑还是算法推荐,如何从海量信息中筛选出最优质的内容提供给消费者至关重要。

那么,筛选的标准是什么?出于利润最大化的角度,媒体会给消费者推荐他们喜欢的内容。问题在于,从社会福利角度出发需要媒体提供的内容和消费者表面上想要看到的内容并不一致。一方面,消费者想要看到的信息往往并不能反映事实真相,这导致了所谓的“媒体偏见”。例如,人们可能更偏好与自我认知相符的极端的媒体倾向,而不是那些与自我认知相冲突的更准确和中立的新闻观点。另一方面,消费者往往只看重信息的娱乐价值,这导致许多优质信息被忽略。例如,人们可能更想要看到明星的八卦新闻,而不是那些对于人们日常生活中做出决策更有帮助的信息。算法推荐的潜在风险之一就是算法更擅长迎合消费者的这些偏好,从而在无形中损害了社会福利。

媒体偏见来自何处

消费者通过媒体获取信息,对于理性的消费者而言信息的质量由其准确性来衡量。在这种情况下,来自消费者和竞争者的压力使得媒体不得不寻求和传播更准确的信息,就如同产品市场竞争中生产者为了吸引消费者需要生产更好的商品一样。但实际上,媒体不仅向消费者提供信息,还要解读信息、说服消费者甚至提供娱乐价值。为了满足这些需求,媒体会对纯粹的信息进行加工并提出自己的观点。

人们对于事实的认知往往有所偏差,这种偏差可能源于教育经历、过去的新闻报道或对事物的成见,也可能被崇拜或信任的人的观念所影响。心理学研究表明,消费者更喜欢、相信且容易记住那些更符合其自我认知的信息。换言之,消费者更相信自己愿意相信的。例如,认为企业高管都是骗子的人可能更希望看到企业破产的新闻而不希望看到企业成功的新闻。媒体可以通过挑选有利于或不利于新闻报道对象的信息来迎合消费者的这种偏好。例如,媒体可以引用某个信息来源,却不承认另一个信息来源对同一组事实有截然相反的解读;媒体可以只选择部分数据来支持自己的结论;媒体可以通过挑选标题和图片来吸引那些不在意具体信息的受众。总而言之,即使不存在假新闻,媒体也可以通过不展示事实的全貌来形成媒体偏见。

那么我们自然要问,人们为什么更偏好媒体报道符合其自我认知的信息?一种可能的原因是,人们想要知道真相,但不确定媒体报道的是否是真相,而他们倾向于认为符合其自我认知的信息接近真相的可能性更大。例如,如果人们十分确信某位名人已经去世,当看到有关该名人还在出席活动的媒体报道时,人们可能怀疑该媒体的信息来源不够权威、对信息的解读有误或是在别有用心的扭曲信息。Gentzkow and Shapiro (2006) 在经济学顶级期刊Journal of Political Economy发表的论文表明,为了建立良好的声誉,媒体的最优策略就是不报道那些不符合消费者自我认知的信息,即使媒体自身认为那些信息更接近真相。在这种情况下,使消费者有更多途径在报道发布之后观察到事实真相(例如加强媒体行业的竞争,从而使消费者可以对照其他媒体的报道)会有助于缓解媒体偏见。当媒体想要通过扭曲信息来建立声誉时,一旦其他媒体选择曝出事实真相,存在媒体偏见的信息将会受到质疑。这也解释了为什么天气预报、体育竞技比分、股票价格等可以在新闻报道之后马上得到验证的信息存在媒体偏见的可能性较低,而货币政策的影响、全球变暖的证据等即使在新闻报道很久之后也难以验证的信息存在媒体偏见的可能性较高。

另一种可能的原因是,人们只想被告知他们是对的,并不在乎真相到底是什么。例如,希拉里的支持者更愿意关注那些支持希拉里的媒体,因为这样他们就不会看到有利于特朗普的新闻报道。因此,即使支持特朗普的媒体报道的新闻更接近事实真相且人们了解这一点,也不会影响希拉里的支持者对于支持希拉里的媒体的需求。在这种情况下,加强媒体行业的竞争反而可能使媒体偏见更加严重(Mullainathan and Shleifer,2005),这和第一种原因导致的媒体偏见截然不同。原因在于媒体此时的最优策略是将目标客户锁定为与其自身立场相近的人群,并通过选择更极端的媒体偏见与其他媒体区分开来,从而加剧了消费者在认知上的“自我隔离”(不同立场的人选择的媒体在媒体偏见上也相去甚远)。这就如同在法庭审判过程中,陪审团中有一半的人只听取被告的陈述,而另一半只听取原告的陈述。有人可能会说,只关注和自己立场相近的媒体报道只是为了得到价值观被认同带来的愉悦,这并不影响对事实真相的了解和相信。然而,媒体偏见会潜移默化的影响你的自我认知,当你频繁的看到有媒体偏见的新闻报道时你心目中的“真相”可能也在悄悄改变。

信息太少娱乐太多

个人想要媒体提供的信息不同于社会需要媒体提供的信息的另一个重要原因在于人们往往只看重媒体的娱乐价值。人们基于信息做出决策,而许多决策不仅影响决策者本身,还可能影响他人,即存在外部性。某些信息的娱乐价值并不高,甚至还需要消费者投入时间精力去理解,但却有助于消费者做出更明智的决策,包括一些涉及公共利益的决策。因此消费者有激励去“搭便车”,即让他人付出时间精力去获取这些信息以做出更好的决策,自己则有可能从别人的决策中受益。这也可以解释为什么媒体使用算法推荐以及在媒体行业引入竞争都可能损害社会福利:媒体更有能力或激励给不同消费者提供他们想要看到的信息(如明星丑闻)以迎合其偏好,而不是提供那些从社会福利角度来说更需要提供的信息(如对经济政策的解读)。当然,鼓励媒体去提供所谓的优质信息也并不保证能解决这一问题。首先,当消费者发现媒体提供的信息不满足其偏好时可以干脆选择不接收任何信息(例如,不看任何新闻而是选择其他的娱乐方式作为替代品)。第二,即使消费者愿意接收这些信息,也并非所有消费者都可以有效的“消化”和记住这些信息。第三,算法难以去定义哪些信息是所谓的优质信息,例如在同一时期有关自然灾害的信息和有关疫情扩散的信息算法需要抉择报道的优先顺序。

总而言之,媒体行业运用算法推荐的潜在风险不可忽视,相信未来人工智能的发展会使得媒体提供的内容更接近真相并具有社会价值,而不仅仅停留在满足消费者的短期需求。


返回