• 广告

    算法和人类记者需要如何合作

    通过Andreas Graefe
    2017年9月13日
    图片由亚瑟Caranta并在此使用知识共享许可协议。

    这篇文章最初出现在谈话的内容。

    自从美联社自动化2014年季度收益报告的制作和发布,从机器可读的结构化数据自动生成新闻报道的算法,一直在撼动着新闻行业。这种技术——通常被称为自动化(或机器人)新闻——的前景是诱人的:一旦开发出来,这种算法可以以很少的成本就某个特定话题创造无限数量的新闻报道。与人类记者相比,他们可以更快、更便宜、错误更少、使用更多语言。

    这两种类型的报道可能会紧密结合,计算机将发挥它们的优势,而人类将专注于我们的优势。

    这项技术提供了一个赚钱的机会,为非常小的受众创造内容——甚至,也许,为只有一个人的受众定制新闻提要。如果效果不错,读者们感知质量自动化的新闻在同等价位新闻是由人类记者写的。

    广告

    作为一名自动新闻的研究者和创造者,我发现计算机新闻报道可以提供关键优势。例如,自动化新闻可以比人类更快地分析大量数据中的模式。我还发现了一些重要的弱点,这些弱点突显出新闻业中人类的重要性,人类对新闻价值的判断能力是不可替代的。

    识别自动化的能力

    2016年1月,我发表了《自动化新闻指南这篇文章回顾了当时的技术状况。它还提出了未来研究的关键问题,并讨论了对记者、新闻消费者、媒体机构和整个社会的潜在影响。我发现,尽管有潜力,自动化新闻仍处于早期阶段。

    现在,自动化的新闻系统正在为大大小小的专业受众服务,提供非常特殊的信息,制作新闻概要lower-league体育赛事财经新闻犯罪报告地震警报。这项技术被限制在这些类型的任务中,因为它能够接收和处理何种类型的信息并将其转化为人类能够轻松阅读和理解的文本是有限的。

    广告

    当处理像股票价格这样精确的结构化数据时,它工作得最好。此外,算法只能描述发生了什么——而不是为什么,这使得它最适合只基于事实的常规报道,这些事实几乎没有不确定性和解释的空间,比如地震发生的时间和地点。由于计算机化报道的主要好处是它可以快速、轻松地完成重复的工作,所以它最好用于报道需要产生大量类似报道的重复主题,如体育赛事报道。

    覆盖选举

    自动新闻报道的另一个有用领域是选举报道,特别是关于几乎每天都在重大竞选期间公布的大量民调结果。2016年底,我与其他研究人员和这家德国公司展开了合作AX语义以对当年美国总统选举的预测为基础,自动开发新闻。

    预测数据由PollyVote研究项目,该项目还主办了发布结果文本的平台。我们建立了一个完全自动化的过程,从收集和汇总原始预测数据,用AX Semantics交换数据并生成文本,然后发布这些文本。

    在整个选举季中,我们自动发布了近2.2万篇新闻文章英语德国。由于它们来自一个完全自动化的过程,最终文本经常有错误,如打字错误或遗漏单词。我们还不得不花费比预期多得多的时间来排除问题。大多数问题来自源数据中的错误,而不是算法——突显了自动化新闻的另一个关键挑战。

    找到限制

    开发我们自己的文本生成算法的过程教会了我们关于自动化新闻的潜力和局限性。确保数据尽可能准确是至关重要的。而且,从一组事实(比如一次投票的结果)创建文本的过程很容易实现自动化。但是增加一些见解,比如将这次调查与过去的调查进行比较,就困难得多了。

    也许我们学到的最重要的一课是我们很快就达到了自动化的极限。当开发规则算法如何将数据转化为文本,我们不得不做出决定,似乎人们容易使——如候选人的领导是否应该被描述为“大”或“小”,信号可以建议候选人在民意调查中有动力。

    这些主观的决定很难形成预定义的规则,这些规则应该适用于历史上发生过的任何情况,更不用说适用于未来数据中可能发生的任何情况。一个原因是背景很重要:例如,希拉里在大选前领先4个百分点是正常的,而特朗普领先4个百分点则是重大新闻。理解这种差异并据此解读数字的能力对读者来说至关重要。这仍然是算法难以克服的障碍。

    但是,在报道例行的、重复的、基于事实的报道时,人类记者将很难战胜自动化,这些报道只需要将原始数据转换成标准写作,比如体育概要或公司盈利报告。算法将更快地识别数据中的异常情况,并至少生成许多故事的初稿。

    然而,人民并不是一无所有。记者有很多机会承担算法无法完成的任务,比如将这些数字放在适当的背景下,以及提供深入分析、幕后报道和对关键人物的采访。这两种类型的报道可能会紧密结合,计算机将发挥它们的优势,而人类将专注于我们的优势。

    Andreas Graefe是Macromedia大学的天空研究教授。

    标记:算法 自动化的新闻 大数据 机器人的新闻

    评论都关门了。

  • 广告
  • 广告
  • 我们是谁

    mediasshift是媒体和技术交叉的洞察和分析的首要目的地。mediasshift网络包括mediasshift, EducationShift, MetricShift和Idea Lab,以及研讨会和周末黑客马拉松,电子邮件时事通讯,每周播客和一系列数字化在线培训。

    关于MediaShift»
    联系我们”
    赞助商MediaShift»
    MediaShift通讯»

    在社交媒体上关注我们

    @MediaShiftorg
    @Mediatwit
    @MediaShiftPod
    Facebook.com/MediaShift