数据新闻:“讲一个好故事”?
——数据新闻对传统新闻的继承与变革
作者:李岩/李赛可来源:浙江大学学报
本文尝试回归到数据新闻生产实践,以新闻工作者的经验性论述与对应新闻报道文本为研究材料来加以探析。因为新闻常规会在新闻传播者的认知及其所建构的文本中体现出来,这些经验性论述对于数据新闻而言是一种“具有制度性的谈论方式,同时规范及强化行为者的实践行动”[11]35,与其他力量一起形塑了新闻如何报道以及新闻作品的呈现样态,并且逐渐在日常采编流程、业务培训、薪酬体系等规训手段下变成生产常规,使新闻生产变得稳定一致。借助这些经验性论述的文本分析,可以洞悉数据新闻生产者对新闻故事的理解,以及如何在日常实践中将事件转化为故事。
一研究材料与方法
(一)研究材料
本文将《数据新闻手册》(TheDataJournalismHandbook)作为主要分析材料。该书是全球第一本数据新闻制作指南,源于年在伦敦举行的MozFest(MozillaFestival)大会中的48小时工作坊,后来在欧洲新闻学中心和开放知识基金会的倡导下,由国际数据新闻倡导者合作完成。该书涉及的内容主要包括数据新闻的定义、重要性、新闻编辑室、经典案例、具体操作程序等。研究者感兴趣的是这些内容由来自不同国家新闻编辑室的工作者撰写,且在方式上主要是结合数据新闻室及其从业者所参与的数据新闻实践和经典案例来论述。这些经典案例有许多在全球数据新闻奖中被提到,而且已经可以看到的是,该书目前已在数据新闻业界和学界被当作范例来引用与论述②,对一个正在兴起和形成的领域而言,能起到库恩所言的范式作用[13]。这些经典作品的生产者对如何制作数据新闻的论述往往成为被效仿的经验准则,对新闻工作者产生了社会化影响,而论述本身也蕴含且折射出当下数据新闻实践的理念与趋势。
针对要探讨的问题,本文将该书“新闻编辑室的运作”与“案例解析”两部分作为研究文本。前者覆盖了世界范围内11个编辑室工作者代表对数据新闻生产的论述,后者主要涉及18个经典案例的生产过程剖析。本文将每一个案例或对应编辑室的文本作为研究子文本(具体信息见表1)。“案例解析”中18个案例覆盖范围较为宽泛,从一天内完成的数据新闻应用到历时9个月的深度调查,生产主体包括了公民记者、媒体组织、政府、非政府组织、研究机构等。“案例解析”与“新闻编辑室的运作”中新闻从业者的经验论述一样,不仅有诸多数据新闻案例文本,也讲述了国际各大主流媒体如何运营数据新闻,蕴含了其数据新闻的生产理念。虽然研究文本仅为该书之相应章节,但基于前文已论及的该书之编撰理念及内容结构特点,这些文本对反映当下已有的数据新闻实践而言仍具有一定的代表性。
(二)研究方法
对研究材料的研究方法结合了语料库方法和文本分析。主要采用的语料库技术包括词频统计与语境关键词即KWIC(KeyWordInContext)索引查询。词是文献中承载信息、知识概念的最小单位。词的出现频率显示出该词在一定文本中的突出程度,词频越高越能体现该文本的内容,通过词频统计可以发现一定语言材料的词汇规律。语境关键词索引是语料库分析的另一个重要工具,可用于了解关键词的使用语境、典型搭配及语义特征等。通过统计核心词词频及其文本语境、搭配、词丛等信息,可以判别数据新闻主题论述中涉及哪些基本词项、其
语料库分析已为诸多媒介内容与话语分析研究所采用③,它将自然语言要素数据化,对大规模语料提供系统的检索和统计,能够展示一定的语言形式,提供反映语言现象的例证,从而强化、反驳或修正研究人员的直觉[14]12,帮助人们观察到语言背后隐含的意义[15]68。但词频分析将词汇从语境中抽离出去,可能影响到附着于单词的含义[16],尽管借助KWIC索引手段能够一定程度上还原语境,但依然有局限。因而本文试图在语料数据统计与分析的基础上,因循核心词项及其频率分布以及语义搭配所提供的整体视角,再具体结合对应的数据新闻报道,以之作为补充性的资料来源,对新闻工作者的经验性论述进行定性文本分析,寻找内在线索,深入挖掘文献意涵。
借助语料分析软件AntConc3.2.0④,收集互联网上对应章节的电子文本,本文建立了词容为字的语料库。首先通过单项检索概览词项频次的总体分布情况,因为有些词项在词义上同根,故继而在语义分析的基础上采用类别搜索,以获取具有相同词根之词项的总频数⑤。根据词频分析结果,排除居词频前列的英文常见虚词如the、to、of、and、a等,再比较出现频次较高的词。其中“数据”的出现频次为次⑥,为实词词项排名第一位;“故事”词频排名第二,为次;紧随其后的高频词有“项目”、“新闻业”、“新闻工作者”等。
研究材料的论述主题即为数据新闻,故“数据”占据首位颇具合理性。而“故事”在频次上居第二位,则因为故事本身作为一种叙事结构和传统新闻常规之一,为诸多学者所探讨⑦,且从其他文献中数据新闻生产者的论述与访谈记录,也可以看到新闻故事在众多数据新闻生产者话语里出现。因而研究者将其作为研究中心,追问究竟数据新闻生产者如何看待故事?在数据新闻生产中,故事是传统新闻故事样式的延续,还是已经具有了不同的叙事或架构方法?是否蕴含新的理念和价值观?在探讨数据新闻如何讲述故事之前,首先需要对传统新闻的故事常规之样式特征及其理念、意义等做一梳理。
二传统新闻常规之“讲一个好故事"
美国新闻主编坎贝尔总结该国新闻事业的两大传统为发现事实和讲述故事。具体而言,发现事实的传统是把公民当作客户,帮助建立杜威所言之“实用智慧”,而讲述故事的传统是把公民当作观众,通过“审美经验的力量”传递理解或宣泄感情[17]11。被视为全美写作质量最高报纸之一的《华尔街日报》的内部培训教材强调,“讲一个好故事”是读者最基本和普遍的需求。追求深度解析事件、揭示事情真相的调查性报道写作手册亦强调“核心任务是讲故事”[18]。而学者舒德森更是断言,“所有的新闻报道都是故事”[19]。
对故事的强调源于这样一种假设,即“讲故事是我们所以成为人的一个重要部分。我们通过故事来了解自己的生活和世界”[20]序言。人类“对故事的理解完全出于直觉,并且觉得故事总是比枯燥的分析更能激发人”[21]60。因而对作为叙事动物的人类而言,新闻故事提供了一个基于人类心理的接受结构。而新闻的民主、文化传承等社会功能实现的基础在于能否吸引且激发民众的阅读兴趣、认知、思考乃至行动,西方学者基于新闻实践经验与专业理想所提出的“新闻十大基本原则”中的一条,即为让重大事件变得有趣且与受众息息相关[22]7。作为故事的新闻显然比枯燥的信息呈现更具体、生动、有趣。
再者,传统上强调以讲故事方式来报道新闻也有效率的追求,即“通过验证或否定一个故事,记者可以更容易地明确自己所要寻找的信息,以及如何解释它,编辑或出版者可以更容易地评估其可行性、成本、回报和调查项目的进展情况”[18]前言。尽管新闻事件作为社会事实中的一朵浪花,往往具有诸多意义与影响,但通过模式化的故事直接套用情节来审查和组织事实,记者简化并且加快了讯息选择进程,适应了新闻对时效性的要求,提升了新闻生产效率。然而,常规化了的新闻样式也意味着凸显与遮蔽。尽管有其心理上乃至功效上的合理性,模式化的故事生产仍然框定了如何进行主题选择和事件报道,从而影响新闻消息来源选择等,并最终可能阻碍新闻对真实的呈现。
选题上,对新闻是故事的强调,影响新闻工作者从纷繁世界里选择报道的内容。一个事件是否具有戏剧色彩冲突成为决定这个事件是否成为新闻的特质之一。“戏剧色彩是定义新闻时不可缺少的一个特点。如果一个事件具备了某些戏剧元素,那这个事件就会特别地具有新闻价值。”[23]17由此,戏剧元素成了新闻价值的一部分。
写作上,“讲一个好故事”的模式框定了新闻事件该如何报道。甘斯指出,“无论是印刷媒介还是电子媒介,最为基本的样式考量都是新闻只有在转变为故事的前提下才适宜刊载或播放”[1]。把讲故事当作基本新闻要素的新闻撰写模式的显著特点之一,是“给了记者一个很大的空间,可以用来强调新闻事件戏剧性和叙述性的一面”[26]~,也使记者报道时经常会重新调整故事结构,以突出其中的戏剧效果。
基于以上分析,当记者认为“最好的新闻故事是对戏剧化的活动或情感的报道”[1]时,政治将被定义为关于政府与主流政党的事情,且强调政治人物的特质,经济新闻就局限于股票交易、政府政策、通货膨胀、贸易数字、货币供给等,国际新闻被用来指称各国政府间的关系,而国内新闻被分为强调冲突、暴力、劳资争议的硬新闻和软性的人情趣味新闻[28]。如泰玛·利贝斯在检视了以色列电视新闻后指出,西方新闻业普遍具有一种
三数据新闻如何讲故事?
前文在已有研究基础上梳理了传统故事新闻样式在主题选择和报道写作上形成的自身偏见,并指出这些带来了接近真相的诸多不足。然而讲故事被视作新闻的基本要素有其理据,即就人类的心理接受结构而言,“故事情节本来就存在,而且可以说,它是对大的社会背景的具体表现”[21]87。人们定义和报道新闻时总是在信息与故事两头摇摆,这是因为社会现象本身既有表现为故事的一面,也有难以为单一、个人、片段化、戏剧性的故事呈现的作为信息的一面。在读者对“讲一个好故事”之普遍需求外,还有“对信息的需求”[27]序,3~5。因而讲故事与提供信息并不矛盾,可以视作“传播光谱上的两极”[22]。
正如班尼特所指出的,新闻的问题并不是使用了个人化和戏剧性的报道方式,而在于在报道中如何运用这些技巧[21]64。讲述故事如果能成功的话,既能够抓住受众注意力,还能够以一种审美经验之力量来传递理解或宣泄感情。故要拒斥的不是故事,而是传统新闻故事模式在实践中带来的种种局限与弊端。新闻人可以做的是在新闻故事样式的合理性基础上对新闻故事进行变革。如秉承公共新闻事业理念的学者杰伊·罗森提出了“架构故事”的构想,即在一个框架内将报道一个问题的可能方式整合在一起,将公民定位为政治参与者而不仅仅是观众,绘制出接触社群内不同知识阶层的路线图等[17]7。除了围绕实现传媒公共性而从宏观上架构故事之外,还可以具体从叙事结构上兼顾故事与信息的需求,将个人故事与更大的社会议题结合起来。
记者选择一个新闻故事的考虑之一即是否能以及如何更好地抓住受众的注意力。新闻需要也应当追求注意力,甚至可以将新闻学视作一门注意力哲学[17]9,但通过什么方式以及将注意力导向何方则会影响到新闻所能发挥的功能。架构故事因而成为把握受众注意力且发挥新闻之社会功能的关键所在。在当下这个被诸多学者视作新闻业危机的时期⑧,数据新闻作为正在形成与发展的一种实践形态,激发了实践者与研究者对传统新闻理念的改造和更新[32]19,与公民新闻等一起被赋予了新闻革新的期待⑨。分析研究材料可以发现,“故事”是数据新闻工作者经验论述中的高频词。那么,究竟数据新闻工作者如何看待故事?如何讲述故事?这是架构故事首先要了解的。
基于语料库的词频和语境共现检索,与“故事”密切相关的词项有“数据、项目、信息、新闻可视化、团队、调查、应用、公众、互动”等,这些词项构成了数据新闻主题论述的概念结构(见表2:图片无法显示)。
再在语境关键词索引查询的基础上,找到语料文本中与“故事”较频繁共同出现的语义搭配及使用的具体语境(代表性索引行见表3::图片无法显示)。
结合对应的数据新闻报道及实践,可以看到数据新闻讲述的是:一个由“数据驱动”(子文本19)、“需要从数据中识别与挖掘的故事”(子文本25);一个“可视化的故事”(子文本17);一个“复杂的”(子文本1)、“调查的”(子文本26)故事;一个在线的、互动的新闻故事(子文本14);一个“个性化的”(子文本3)、“公民自己生产的”(子文本16)、“他们自己的独特的故事”(子文本1)。
数据新闻依然以叙事为中心,但这种叙事已经建立在新的技术与理念基础上,讲述的是一个为数据驱动、可视化的新闻故事,一个关乎读者且读者自己可以讲述的故事,一个更能把握真实、抵达真相的故事。
(一)一个为数据驱动的故事
语料分析显示,“数据”一词出现在整个研究材料中的每一个子文本中。不管是讲述编辑室运营理念,还是案例分析,“数据”都会高频度出现在数据新闻工作者的论述里。
首先结合语料中的核心词项、词频及语境分析,对数据故事的形成过程进行概述。“所有的数据新闻背后都是一系列作业流程”(子文本22)。数据新闻工作者“在数据中发现新闻”(子文本1),通过一系列工具、技术、软件等来制作完成相应的数据新闻项目和应用等,以满足公众对数据的需求。数据新闻制作一般需要更长的时间,且往往由团队来完成。就团队构成而言,除了传统的新闻工作者外,还包括负责程序和设计的人员等,担任的角色不仅是报道者,还是开发者、设计师等。
再以“数据”作为搜索词,基于语料分析找到搜索词的搭配和分布情况(代表性索引行见表4:图片无法显示),联系案例中对应报道文本来分析数据新闻工作者对数据使用的主要认识。
数据新闻工作者认为,“在信息时代,记者们比以往任何时候都更需要组织、验证、分析和综合数据的洪流”⑩。他们试图讲述一个“数据驱动的故事”(子文本19),致力于从数据中识别与挖掘故事,数据采集、过滤等处理成了数据新闻生产最重要的环节。且“对数据的使用使记者的工作核心由追求新闻报道的时效性,向讲述某一事态变化发展背后的真正含义转变”[33],这些使数据新闻致力于讲述一个更为复杂的故事,在选择和评价新闻故事的适应性时,侧重点从行动或事件转向情境。如案例1“机遇鸿沟”强调其新闻应用能够讲述一个“整体”又“详尽”的故事,向读者呈现一个宽泛的、梗概性的全国图景,这个图景对各州在教育资源分配上的表现进行比较,帮助读者了解全国教育资源配置,以及贫困在多大程度上决定了教育资源的配置。
因为致力于讲述更为复杂的故事,这些数据新闻实践一般需要处理大规模数据。统计显示,除了一个案例提到了小规模数据处理之外,其他案例论述一般会强调数据规模之大以及数据处理之繁杂。如案例11“医护费用”中,为了调查并报道加州一个大型医疗机构利用联邦医疗保险项目牟取超额利润,加利福尼亚观察网的调研员需要收集和处理十分庞大的数据,每年就有万病例,而报道者希望能够研究六年来的记录数据来考察模式变化。再以案例15“阿根廷的公车补贴”为例,当时阿根廷混乱的公交系统每天会影响到名乘客的生命安全,且延误、罢工、车辆故障等事故频发,该数据项目试图调查阿根廷公交系统补贴取向,并且通过应用设计让每位阿根廷公民都能了解补贴数据,为此需要调查全国公交公司每月所获补贴。工作人员查阅了阿根廷交通部网站上自年开始政府每月对多家公交公司的现金支付金额,涉及项PDF文件,台车辆的车牌号,每月从政府获得的维修保护费用,以及所属公司名称和信息。大规模数据的处理由此成为数据新闻工作最为基础与核心的部分,也使新闻价值上从追求时效性、冲突、戏剧性转向全面、深入、精确地呈现社会事实。
需要指出的是,尽管这些数据新闻实践较多涉及大规模数据的处理,在相关文献梳理中亦有学者认为数据新闻要处理的是大数据,且往往以数据规模来衡量该类新闻价值的大小,但研究材料的文本分析亦显示出有些数据新闻工作者并不认为一定要依托大型数据库。如在案例16“公民数字记者”中,来自巴西公民媒体项目“珍纽瑞亚之友”(FriendsofJanuria)的实践显示,在引导巴西城市珍纽瑞亚的当地青年提出信息自由之要求以及进入互联网上的官方数据库去获取公开披露的信息后,他们能以这些数据库为原材料,开发小规模数据库和数据表,发现极具价值的信息。
在数据新闻项目与应用的开发中,数据新闻发现且试图满足公众想要了解各种数据的需求。如《卫报》数据博客的编辑指出,该博客启动时设定的读者群是那些制作应用程序的开发者,而实际上却是广大的普通读者想要深入了解各种数据(子文本22)。为此,数据新闻工作者为普通公众提供了大型数据库的进入方式。如在BBC推出的庞大数据库“每条道路上的每例死亡”里,用户仅仅通过邮编搜索,就能找到过去十年中每场道路事故发生的具体位置(子文本20)。
为了从数据中发现有价值的新闻,往往需要“花大量的时间对数据进行筛选”(子文本20),以及更多数据挖掘的技能。数据新闻是“更费时的”,有时新闻工作者“花了数小时收集数据,结果发现它们没有一点用”(子文本3)。在采集与处理数据过程中淘汰错误、过时的数据,挖掘出有新闻价值的报道,数据处理要求更多相关技能,“要将各自不同的技能——精深的专业知识、对数据实现最优化的理解、设计与编程能力等融合起来”(子文本1)。一方面,这对新闻工作者技能提出了更高要求,如BBC数据新闻团队尽管各自有自己专属的身份,如记者、研发人员,但他们勤于学习,不断增加对彼此专业领域的熟悉和了解。没有哪个记者专门司职处理数据,但所有编辑人员都必须熟练掌握一些基本电子表格的应用技巧,以便分析数据(子文本20)。另一方面,新闻编辑室可以通过专业人才之分工与协作来获得所需技能,且研究材料里提到的团队构成都将传统新闻工作者与技术人员统合起来,所涉及的全部案例亦都基于协作完成。澳大利亚广播公司的温蒂·卡利斯勒(WendyCarlisle)认为,真正的数据应是跨领域的,数据新闻团队由过去从未共事过的人员组成。接下来的日子,传统新闻工作者将与电脑黑客、开发设计师、编程人员并肩作战(子文本19)。
数据新闻实践中,数据成为重要的信息源。我们需要
研究亦显示,在互联网社交媒体发展的基础上,数据来源除了政府及其他公共机构外,还可以是商业机构与普通民众。如案例9中,《卫报》的数据博客对英国暴动的报道和案例13“无所不知的电话”里披露的个人行踪数据皆来源于商业组织。案例18“众包水价”则显示出数据获取的众包方式能够发挥巨大助益。该案例通过为水价网站设计一个众包界面,用户可以扫描水费账单、输入支付水费,在4个月内即有人在界面所在网站注册,并上传了超过份通过验证的水费单。
在通过数据强化新闻报道叙事能力的过程中,数据新闻工作者既将数据视作其工作最为基础与关键的环节,亦强调数据只是工具,它仍然是在讲述故事,讲述数字背后关于人的故事(子文本3)。数据新闻工作者会认为数据能够用来核实各个拥有自己议程的信息来源提供的主张辩解等(子文本11),但亦有所反思,如怎样保证数据新闻的真实性和准确性?收集手段是否科学?来源是否可靠?数据是否有代表性和可比性?有数据新闻工作者指出,“相对于其他事实,数字更可能被粗浅地解读,因为数字被戴上了象征严谨的神圣光环,即使是完全捏造的也不例外”。强调记者要增强对数字的批判意识,要正确使用数据,对此开出的处方是“数据的熟悉运用”[33]。
(二)一个以可视化方式讲述的故事
“可视化”在论述经验文本中是排行前列的高频词(11)。再结合文本分析可以发现,可视化是目前数据新闻工作流程中的一个关键环节,《数据新闻手册》辟出专门篇幅集中论述如何实现可视化操作。这里只是就研究材料进行语料分析,在语境关键词索引查询的基础上,结合对应具体报道的文本分析来获得探索性发现,了解数据新闻工作者如何认识与实践可视化(代表性索引行见表5)。
就“可视化”这一主题词分布而言,11个新闻编辑室论述文本里只有2个未涉及,18个案例文本中尽管有7个未涉及该词汇,但出现了意义接近的词如“图解的”、“视觉新闻”等。虽然有的因为论述主题强调数据采集与分析等而没有涉及相关词汇,但18个案例所对应的新闻报道都明显使用了可视化手段。对数据新闻而言,可视化不仅仅是美学形式的追求,更是一种功能需要,借以生动、有效传达大量且复杂的信息。即如数据新闻工作者指出的,可视化处理技术与研发人员的技术一起“构成了每一个数据项目的核心组成部分”(子文本20)。
数据新闻工作者认为利用可视化技术可以将抽象变得具体,将复杂变得简单,以往需要长篇累牍地描述或解释的新闻故事现在可以在大数据信息处理技术条件下变成清晰易掌控的静态或动态视图。如《卫报》数据博客的新闻工作者强调可视化对英国暴动报道的重要意义,认为关于谣言在推特上传播方式的可视化作品“对故事的讲述大有帮助”,“有力地展现那些难以描述的东西,表明了谣言病毒传播的本质,以及谣言的生命周期如何随时间变化的方式”(子文本9)。BBC编辑室则列举了一个欧元区债务网上的专题报道,该报道的主题是欧元区各国错综复杂的国内贷款,为了鼓励用户去
这些数据可视化手段在数据工作者的眼里,“能够提升读者对故事的接受程度,也是整个编辑团队展示内容的一种很有吸引力的方式”(子文本23)。如Zeit在线的数据新闻工作者指出,他们参与的案例“基于PISA的财富比较项目”试图比较不同国家的生活标准(12),这是一个宏大的复杂主题,但该项目对经济合作与发展组织(OECD)一份报告所提供的数据进行分析与可视化,通过将财富、家庭情况、获取知识的来源等指标转换成自我解释性的图标,可以像纸牌游戏一样实现不同国家之间的比较,并且基于Raphael-Javascript类库创作出了高质量且漂亮的交互气泡图,带来了巨大的访问量(子文本23)。
可视化常常会调用互动手段,交互性可视化、互动式地图是研究文本里较为频繁出现的词项搭配。互动是互联网平台相比传统媒体而言的一大优势,从已有案例来看,这些数据新闻实践绝大部分都调用了互动手段,认为通过互动设计可以提升用户的兴趣、参与感和使用体验。如BBC使用联合国人口发展基金提供的数据所做的专题:“70亿人口的世界:你是第几个出生的人?”用户只要输入自己的出生年月日,就可计算出自己是全球第几个出生的人,并可以通过Twitter和Facebook分享其排名。这个专题成为英国年Facebook上人气最旺的分享链接(子文本20)。
另外,互动本身能够成为新闻的一部分。通过互动可以获取更多的用户信息和数据,并且还能赋权于普通公众。如前文提到的案例18“众包水价”通过交互界面来获取用户上传的水费单。案例3“欧元区的垮台”则通过交互性页面获取用户分享的欧债危机下家庭、个人的回应与故事。案例14“MOT测试失败率报道”则通过交互设计向用户开放报道中涉及的原始数据,鼓励用户使用软件参与新闻制作。在经验论述中,来自BBC的马丁·罗森鲍姆(MartinRosenbaum)认为,数据新闻工作者的任务是“发现与共享”,其他人或许能够找出已有新闻工作者所遗漏或忽略的,可以在已有基础上进一步深入细致地研究数据,或运用不同方式呈现数据,实现视觉化。并且这种分享还将问责制和透明度融入新闻报道过程中(子文本14)。可以看到,借助于交互手段,数据新闻故事更容易与普通公众相关,普通公众更易于参与生产和传播,这一点将在后文进一步分析。
数据新闻实践中的可视化手段往往是综合的。以澳大利亚广播公司ABC举例提到的数据新闻作品“数字上的煤层气”为例(13),这个数据新闻作品的叙事手段包括了交互地图、数据可视化以及文本。其中交互地图涉及的是澳大利亚煤层气气井分布和租赁情况,读者可以按地理位置搜索查看,除了整体分布及气井周围情况外,提供的信息具体涉及气井的当下状态、深度、开发商名称以及钻井日期等,且读者可在租赁情况和气井分布两种模式之间自由切换。另外,还采用数据可视化的方式来分析煤层气开发带来的废盐、废水等问题(子文本19)。在叙事策略上,通过联想、比喻、对比等可视化的具体手段让抽象晦涩的现象统计变得简洁易懂。如采用“水滴”图形来标识澳大利亚人的用水指标,用地图将空间可视化等。
可视化手段的实现依赖于一系列工具,被数据新闻工作者提到的主要有:地图(尤其是谷歌地图)、矢量图形库、Excel宏、绘图产品TableauPublic、谷歌免费分享数据的网络工具FusionTables、Junar开放数据平台等。由此,可视化与数据采集和处理一样意味着新闻工作者需要掌握新的技能,包括图形可视化和高级研究技能等。为了掌握和利用这些技能,有的媒体机构会自己组建传统记者、程序员、设计师、学术研究员等合作团队,有的则会咨询对应专家(子文本19)。不管采取哪些方式,与数据采集和处理技术一样,可视化技术成为新闻工作者所需的技能之一。
与对数据的反思一样,从数据新闻工作的讲述里也可以看到他们对可视化的反思。如可视化技术里表格和地图是目前常见的视觉表达手段,但有新闻工作者认为,仅仅以表格或地图呈现,会让原本整个连贯的故事显得断裂,需要更好地进行可视化设计,以呈现生动的新闻故事(子文本17)。BBC的数据新闻经验分享则强调用户体验,提出“数据可视化团队的工作就是将一些很棒的设计和编辑叙述结合起来,从而为用户提供引人入胜的体验”(子文本20)。从这些论述里可以发现,美观与信息、设计与编辑是可视化的两个基本点,并且数据新闻工作者认为可视化的美化设计元素最终植根于事实的故事讲述。如来自《纽约时报》的阿隆·菲尔霍夫(AronPilhofer)在讲述其团队对年美国大选总统选举结果的数据新闻报道时特别强调:
理想情况是,一则真正出色的视觉新闻兼具美观与实用性。但当我们要在故事和审美上作出抉择的时候,记者们必然会选择故事性这一边。虽然这样呈现数据的版式布局并非单纯的设计师所设想的那样,但能将故事表达得非常清楚,让新闻充满可读性。(子文本17“选举结果大看板”)
对数据新闻工作者而言,可视化和数据采集处理技术一样丰富拓展了新闻报道的叙事能力,并且被视为数据项目的核心组成部分,但可视化亦最终服务于讲述新闻故事。不过,借助于可视化,新闻故事更为生动、清晰、可读,让人印象深刻,并且通过交互设计而提高了参与度,可以与普通公众更相关且是为他们自己讲述。
(三)一个与普通公众相关的故事
传统新闻故事基于对时效性的追求,以及囿于消息来源的易得性和易用性,其报道
分析研究文本中除了案例7“新闻中的数据玄机:维基解密”对阿富汗战争的解读日志以及案例9“《卫报》的数据博客对英国暴动的报道”属于典型的重大且具历史意义的事件之外,都将
但如果只
其一,在新闻记者采访所获得的人物故事之外,通过界面设计增添了更多个人化叙述的故事。如《华尔街日报》对欧元区垮台的报道在处理海量数据基础上制订好记者的报道计划,要求他们去探索有趣的故事,让读者更近距离感受欧债危机,并且设计交互性页面以获取读者观看后分享的故事,这些故事来自欧洲的不同类型家庭及不同世代、不同经历的人(子文本3)。采用个人逸事来讲述新闻故事被视为“有色彩”的[34]8,可以带来“地方感”,使人觉得说话的是活生生的普通人而不尽是官员。且当人们对讨论的事件有直接经验时,会以更具分析性的、联系社会实际的方式来解读新闻,并且采取行动。如威廉·盖莫森指出,有证据表明,当人们把个人经验与政治事件联系起来时,就开始与具有相同经验的人们产生认同感,并采取政治行动[35]。
其二,除了选择主题与公众相关外,在数据新闻编辑的经验论述中强调要帮助公众(研究文本还较多使用“读者”“公民”等)了解各类事件或主题。如案例4“通过OpenSpending.org报道公共支出”中,强调该报道是为了增进新闻工作者和公众对财政的了解,作为项目“花销的故事”里的一部分,该报道让用户将公共支出和有关公共支出的报道相联系,来看“新闻背后的数据和数据背后的新闻”(子文本4)。
BBC数据新闻编辑室强调数据新闻的报道原则之一,即为帮助读者更好地理解复杂议题,且让故事成为读者可以个人亲自参与的。为此,在新闻实践上他们提供了大型数据库的探索方式,以其年推出的“学校排行榜”为例,使用政府每年公布的数据所推出的应用能够帮助用户通过邮编找到当地学校,并根据一系列指标进行比较。BBC数据新闻编辑室还制作了简便工具,可以为用户提供个性化信息。如BBC推出了一种预算计算器,用户通过使用该计算器,可以预见财政大臣的预算生效后可能产生的更好或更坏的影响,然后分享计算结果。这些工具赢得了那些缺乏时间做冗长分析和搜索的用户喜爱(子文本20)。
在新闻编辑室经验分享里,《芝加哥论坛报》新闻应用团队将“帮助读者在数据中发现他们自己的故事”作为数据新闻挖掘的动力和意义,其具体论述如下:
我们真正的动力应该来源于我们的作品对人们的生活、法律以及政治家的监督,等等。文字报道能够反映社会趋势并且通过几个具体的故事使之更加人性化,但当读者读完报道之后他们会做些什么呢?他们的家庭是否安全?他们的孩子是否接受到公平合理的教育?我们工作的意义在于能够帮助读者在数据中发现他们自己的故事。(子文本21)
通过“他们自己的故事”,数据新闻在主题上对现实生活中普通民众相关事务的呈现能够引导读者从普通公民的角度来理解公众事务,并且鼓励公众参与。而对新闻工作者而言,当官员成为消息来源的时候,记者与官员定期接触所形成的关系使他们更容易同情这些官员,导致消息来源单一而且“系统性地偏袒某些人物、团体或组织”[37]2。而当社会公众成为消息来源和参与者时,新闻工作者在报道上也能更同情民众,真正专注于为民众提供新闻服务。
(四)一个为读者自己讲述的故事
“让数据新闻成为个人的”(子文本20)。“生产数据驱动新闻故事并非大型新闻编辑室的专利,这些对数据新闻工作者而言有用的技能同样能够帮助公民数字记者访问本地数据,并且转化为故事。”(子文本16)语料库分析显示,“欢迎参与性用户且为他们服务”的理念在论述经验文本里多有呈现,与之相关的词项有“个人的、亲自的、互动的”等等,因为在表述上较为分散,难以采用之前的关键词索引行来呈现,故下文将通过引文来具体分析。
理念具体体现在数据新闻文本的交互性设计和新闻应用上。就这里涉及的18篇案例文本而言,全部都设计了交互性应用,并且会与常用的社交媒体相联系,将UGC内容纳入专业新闻文本里。语料文本中主要涉及的社交媒体有Twitter、Facebook等,并且在论述里强调了“网络”、“在线”等,数据新闻因而是一个“在线的故事”,它充分利用了互联网及社交媒体的影响力,让新闻变得更具个性和互动性。事实上,这亦为其他研究所证实,根据学者对英国《卫报》数据新闻频道中“美国大选报道”专辑中55篇相关报道的研究,用社会化媒体吸引用户参与数据新闻的制作与传播是这些报道的重要特点之一。每篇报道都设置了按钮,以方便用户浏览时可以分享到Facebook、Twitter、Google+等[38]~。
回到具体文本,在案例1“机遇鸿沟”中,数据新闻工作者认为不仅需要通过复杂的新闻故事来解读、呈现复杂的社会,还需要让读者能够参与故事生产,这也是数据新闻工作者引以为豪的。该案例相关的新闻作品除了概述性新闻报道外,还在社交媒体Facebook上提供了交互式新闻应用,读者登录社交媒体后可以从庞大的数据库中找到自己所在区域或所关心区域的学校并查看该校相关教育资源(14)。而案例3“欧元区的垮台”则通过全方位展现欧元区的家庭来讲述欧债危机的故事,让读者能够更近距离感受欧债危机中不同世代不同经历者的声音。该案例也设计了交互式页面,用来获取不同读者看完照片后的反应和分享的故事,使用的符号有图片、声音、数据等。对这些报道来说,读者被视作能与报道信息互动的人,而不仅仅是信息的消费者。当公众的故事和观点以这种交互方式得以采集与呈现,人们既是信息接收者,又是信息生产与发送者,在倾听和被倾听的互动过程中,新闻真正成为“对话”的新闻[39]。
除了通过互动设计和应用将UGC内容纳入专业新闻文本外,数据新闻报道还向用户开放新闻报道的原始数据,鼓励、教授用户使用软件参与新闻制作,帮助他们讲述自己的故事。如案例1中的数据新闻工作者认为,他们引以为豪的是所设计的新闻应用能够讲述一个复杂的故事,但更为重要的是,能“帮助读者讲述他们自己独有的故事”(子文本1)。在案例14中,除了报道所获结论外,还在BBC新闻网站上公布了相关的电子数据表,并且任何访问者都可以使用这些数据自己进行分析。前文已经提及的案例16“公民数字记者”里,巴西公民媒体项目“珍纽瑞亚之友”的数据新闻工作者同样津津乐道的是,他们成功帮助了毫无新闻背景的用户结合他们当地的情况以及感兴趣的领域来生产制作数据新闻。在这个案例中,数据新闻工作者帮助巴西境内小城市的当地居民学习基础新闻技术,并提出“信息自由”之要求,帮助他们进入互联网上的官方数据库等,在参加完12期的研习班后,一些完全没有任何记者背景的年轻人也能够写出由数据驱动的新闻故事,呈现出当地有趣的民生百态。对此,这些数据新闻工作者认为,公民记者能够利用数据来完成新闻稿,并不需要同大批专业人员一起待在大型新闻编辑室中(子文本16)。
这些实践体现了数据新闻中的“开源”理念(15)。开源在技术上指的是一种透明与参与式编码,所有源代码能够被所有人使用、修改,且这些修改其他人又都能任意获得[40]15。其蕴含的理念即分享,也是网络诞生以来发展出的黑客伦理之核心,在实践中能够为群体及其行动提供更广泛的平台。可以看到,有些数据新闻团队正在做的便是开放专业生产与把关之门。谁来生产这些“数据故事”(16)?记者、信息设计员、计算机科学工作者?除了这些专业人士形成的职业团队之外,还有对此有兴趣的普通公众。
开放源数据平台也是研究材料中出现频次较高且是被视为数据新闻传奇的《卫报》数据博客一直贯彻的,即分享数据、文章和问题。这种新兴的发布平台赋予个体数字化收集、共享数据以及将其转化为信息的能力,以开放式互动提升受众参与制作及解读数据新闻的能力,以求建立良好的数据资源生态。因为参与者和信息的增多会使数据表达的事实更为准确,而且正如数据新闻工作者在实践中指出的,还能够进一步拓展新闻工作者由于时间和技术限制的有限报道(子文本14)。这种参与也能增加用户对新闻的
从开源理念及其实践可以窥见,参与数据新闻的计算机程序员及其理念正在挑战传统新闻常规。如同学者在梳理众多
“每一次技术进步都或多或少地重新界定了公民角色”[44]10。如果说在传统新闻故事中,公众更多处于被动解读与消费的位置,那么数据新闻实践正在持续
(五)一个更为复杂并接近真相的故事
虽然现代新闻业秉承的原则是“要对真实负责”[22]5,职业信条是“坚守真实,探求真相”[45]45,但对真相的探求受限于普遍的权力机制,且人类认知结构自诞生以来就只能片面地呈现事实。这已为学者认识并限定了对新闻职能的期待,如沃尔特·李普曼在20世纪20年代探讨舆论一书中指出的,新闻的职能是要凸显一个事件,而真相的职能是“探明隐藏的事实,并使其彼此发生关联”[46]。他认为只有当社会条件达到可以认知和可以测量的状态,真相和新闻才会一致,但显然并不能因为认识到一定时代环境下新闻呈现事实的局限就放弃赋予新闻业的理想和原则。为了更全面地呈现社会事实与接近真相,新闻业务需要发展出一种更有效的信息处理、组织与传播方式。而数据新闻之所以诞生伊始便被赋予厚望,原因之一是它突破了传统新闻中已经认识到的某些不足,在叙事上能够讲述一个更为复杂也更能接近真相的故事。这从研究文本的语料和文本分析可以推出:
数据新闻工作者可收集、合成并呈现各种各样且常很难获取的信息,帮助受众真正深刻理解复杂议题。相比单纯地循环使用新闻稿,将其他地方听到的新闻事件再重述一遍,数据新闻记者能用交互式图表和直接获取的第一手资料给读者一个清晰明了、可理解且更好地量身定制的观点。这些观点不是琐碎的,而是有价值的。(子文本29)
这较为典型地论述了数据新闻工作者对数据新闻叙事能力的认识。数据新闻工作者认为他们可以,也应该讲述一个复杂的故事,让读者能更好地理解复杂议题。正如有学者指出的,“一个事件具有新闻价值并不仅仅因为事件本身,还因为我们能用已有的叙述符码对其进行叙述”[47]70。传统新闻从业者认为读者对较长的故事会更容易丧失兴趣,讲故事力求简短,需要长篇累牍地描述或解释的新闻有时会从故事清单里剔除,因而经济主题、复杂议题常不被触及[1]。但借助于数据化和可视化等叙事手段,这些不愿被触碰但又往往关系到公共生活之必要且有用的信息可以被有效报道,且以一种简单、清晰、更容易为受众所理解的方式。即如来自“德国之声”的一位数据新闻工作者指出的,借助于数据采集、数据分析及视觉化等数据工具和技术,人们越来越有能力去把握和理解那些极其繁杂的议题,如国际金融、债券、人口、教育等(子文本29)。
整体分析研究材料的新闻议题可以发现,数据新闻明显更偏向于社会问题报道(如案例12“养老院危机”、案例13“无所不知的电话”),更多
数据采集与处理是复杂的、“更耗时的”(子文本3),数据新闻工作者一般不以第一报道事件为追求,而是要成为值得信任的信息来源。针对一个复杂议题,在空间上,数据新闻工作者收集、整合并呈现多种多样甚至获取困难的信息来给读者提供真正的洞见,通过互动图形以及直接采访主要信息来源,带给读者一个简洁、全面、适宜的视角(子文本29)。在时间上,将事件置于历史语境中。如同美国学者所言,最好的新闻报道“不会解释了一个事件之后就跳到一个又一个其他的事件,而是长期追踪事件的重要进展,提供信息,使人们了解利害关系,知道如何参与其中,介绍社区的整体运转状况”[36]9。
因为往往要深入探析一个复杂的题材,数据新闻会采用调查新闻的模式。“调查”在研究材料中是一个高频词,出现频率为62次,且语义集中度非常高,无论是点明数据新闻作为调查新闻(报道),或者作为动词,都强调了该词本义,即深入考察。另据研究者统计,在年首届全球数据新闻奖参赛作品里,数据驱动调查类新闻占到了项,即总参赛作品的42.3%,将近一半。且根据分析,数据新闻目前发挥特长的领域是调查性深度报道。一般认为大数据有助于深度报道之创新[48],使以往调查事实和舆论所依赖的随机样本可以为更全面的样本所代替,而且还可以利用计算机和互联网进行更深入的数据搜寻。
通过讲述一个复杂故事来抵达真相这一理念也为数据新闻工作者所内化和追求,正如《金融时报》的数据新闻工作者辛西娅·奥墨楚(CynthiaOMurchu)所强调的,数据新闻在实践上不应该只是目的性地分析数据或数据可视化,而且应将其作为一种工具来接近世界上正在发生的事情的真相(18)。
四结语:延续与变革
基于数据新闻工作者的经验论述文本对“故事”的强调与阐释,可以看到新技术条件下重组后的新闻编辑室对传统新闻价值和故事样式的继承,与此同时,在故事这个样式场域中也可以看到新闻采集、呈现及其理念的变革。
《数据新闻手册》是一本“仍在进展中”[12]的书。而“数据新闻”也是一个概括性术语,“它囊括了一套仍在不断增多的用于新闻叙事的工具、技巧与方法”,“数据新闻正处在革新过去的操作手法以适应互联网的初始阶段”(20)。这也是一个重新架构故事的好时期。基于对新闻及其民主功能的期待(21),这里借用坎贝尔论述作为民主艺术的新闻事业的话来说,有效的新闻事业需要引导人们 ②《数据新闻手册》已在业界和学界广为传播,相关研究参见:方洁、颜冬《全球视野下的“数据新闻”:理念与实践》,载《国际新闻界》年第6期,第73~83页;李希光、张小娅《大数据时代的新闻学》,载《新闻传播》年第1期,第7~11页;苏宏元、陈娟《从计算到数据新闻:计算机辅助报道的起源、发展、现状》,载《新闻与传播研究》年第10期,第78~92、~页。
③相关研究参见:S.L.Althaus,J.A.EdyP.F.Phalen,“UsingtheVanderbiltTelevisionAbstractstoTrackBroadcastNewsContent:PossibilitiesandPitfalls,”JournalofBroadcastingElectronicMedia,Vol.46,No.3(),pp.~;P.BakerT.Mcenery,“ACorpus-basedApproachtoDiscoursesofRefugeesandAsylumSeekersinUNandNewspaperTexts,”LanguageandPolitics,Vol.4,No.2(),pp.~;钱毓芳、田海龙《话语与中国社会变迁:以政府工作报告为例》,载《外语与外语教学》年第3期,第40~43页;赵凌《媒介·话语·权力·身份:“农民工”话语考古与身份生产研究》,浙江大学年传播学博士学位论文。
④该语料软件是由日本学者LaurenceAnthony开发的绿色免费软件,具有词语检索、生成词表和主题词、检索词的上下文背景等功能。
⑤以“故事”为例,在英文表述中包括了story、stories、storytelling等,故通过词根通配以“stor*”进行搜索。
⑥以“data*”搜索获得,包括:“data”次,以及相关的变异形式如data、database、dataset、datablog等。后续核心词的类别搜索方式类同。
⑦相关研究可参见:甘斯《什么在决定新闻》,石琳、李红涛译,(北京)北京大学出版社年版;[美]塔奇曼《做新闻》,麻争旗、刘笑盈、徐扬译,(北京)华夏出版社年版;[美]W.兰斯·班尼特《新闻政治的幻象》,杨晓红、王家全译,(北京)当代中国出版社年版。
预览时标签不可点收录于话题#个上一篇下一篇