从BBC到路透社 人工智能怎么做新闻

humanoid robot tapping its head Image copyright Getty Images

从人工智能进驻新闻机构,写稿机器人交出球赛、股市新闻稿,到机器人抢独家新闻,前后不过三、四年时间。

刚开始记者们半开玩笑地表示担心机器人会抢走自己的饭碗,后来大家热议机器人写的足球赛新闻比人写的差距多大,再后来,到了现在,关于AI的关注又变了。

人工智能将如何拓展、重塑新闻采编制作流程中的哪些环节?以前有哪些难以想象或不可能的设想借助AI的威力而成为可能?又有哪些环节确实可以而且正在取代人工?

AI在新闻编辑室可以发挥什么作用,这是个自由放飞想象力的话题。

抢独家

人工智能跟人类争普利策奖?其实1988年就发生了。《大西洋月刊》记者比尔·戴德曼(Bill Dedman)在电脑帮助下检索梳理了海量的住房按揭数据,写出系列报道揭露这一行的隐形种族歧视,作品获当年普利策奖。当然,这可以算作机器夺奖。

机器跟人抢独家新闻?这事4年前有人预言过:会编程的记者将能抢先报出独家新闻,抢头条。

机器人工程师约翰·基弗(John Keefe)今年1月在哈佛大学尼曼新闻实验室(Nieman Lab)2018行业预测中断言,这件事今年就会发生。他说,记者将运用AI抢得独家新闻。

这跟机器人写足球、财经消息不同。那更多是数据分析整理,然后用自然语言程序组合成文。抢独家消息是通过机器学习技术识别、发掘出人类单凭自己的大脑难以捕捉到的重要事实和真相。

至于未来的媒体编辑室是否由AI主宰,或者人类和机器联合执掌,现在难有定论。

可以肯定的是,适用于工农业生产的逻辑在相当程度上同样适用于媒体内容生成:搜集资料、整理数据、核查事实、版面校对等,这些工序能够也肯定会大部分交给AI,编辑记者可以更集中心智用于创意、创新。

Image copyright Twitter
Image caption 特朗普总统的推特帐号上不全是他亲自发的,人工智能可以识别。

人算不如机器算

人机合作已有先行者探路。美国《大西洋月刊》记者麦吉尔(Andrew McGill)把一项枯燥而至关重要的任务交给了机器人助手,@TrumpOrNot,让它分辨美国总统特朗普的推特帐号下哪些是他本人发的,哪些是手下人代劳的。

这个助手利用机器学习和自然语言处理技术,把特朗普新发的推特文字跟数据库中的文档资料对比,然后做出比较肯定的判断。

麦吉尔在2017年3月发表了自己的实验结果时写道:

“机器算法找到的那些最有助于分辨一则推特讯息出自特朗普之手还是工作人员之手的线索,真的很有意思。大部分不是文字,而是特别的拼写和标点符号。”

比如,特朗普发的推特更频繁出现自己的推特名“@realDonaldTrump”,更喜欢用“媒体”这个词,但显然不爱用“#”,而手下代发的推特讯息里这个符号更多。

麦吉尔承认自己这个助手的知识库需要不断更新,尤其是作为识辨指标的关键词、习惯和特点。

Image copyright ANGELA WEISS/AFP/Getty
Image caption 《纽约时报》大楼里确实正在发生机器抢人饭碗的事。

AI进驻媒体

专注于人工智能领域发展的科技网站TechEmergence对人工智能在几家主要西方媒体的应用做了梳理,勾画机器人进驻编辑室趋势的一个截面。

  • BBC新闻实验室:语义辨识

BBC的人工智能机器人叫Juicer ("榨汁机")。它的任务是把海量的数据,包括每天的新闻、专题报道、视频、其他媒体的消息、政府部门和互联网信息, 等等,用一种聪明智慧的方式联结起来,既方便调用,又有内在智慧逻辑。

"榨汁机"2012年上岗,每天吸进来自850个新闻机构的RSS信息推送,整合处理数据,把BBC和其他媒体的新闻报道分拣出来,然后贴上相应的语义标注,分成4类归档:组织机构、地点、人物、事物。

这样,记者要查找有关特朗普总统的最新消息,或者AI领域动态的信息,"榨汁机"就会迅速上网搜索,然后给出一个相关内容的清单。

这还比较枯燥。不久的将来,"榨汁机"的功能提高后,还会更贴心,读者鼠标在某个字词上停留兜圈片刻,它就能生成一个弹出窗口,提供相应的信息。作为电视广播媒体,BBC还在训练它在视频环境下弹出相关的信息。

  • 《纽约时报》:语义辨识和评论区管理

2015年,《纽约时报》大楼内来了个名叫“编辑”(Editor)的AI。它的任务是简化记者编辑的工作流程。记者写稿时可以用标签来标明关键词、标题或主题。随着时间推移,数据积累到一定程度后,机器编辑就能自动识别这些标签的语义,找到一段文字中最关键的部分。这样,记者查资料或核对事实就很便捷,人物、地点、事件、时间,分门别类,井然有序。

人工智能在那儿的另一项任务是管理读者评论区。它将来可能要承担的是目前共有14个人负责的工作,主要是每天分拣查阅11,000条读者评论。该报开设评论区功能的文章只占10%,如果用AI机器管理,则可以有更多文章开放评论区,强化互动,并节省开支。这个软件叫Perspective API,可以迅速分拣整理读者评论,使读者更容易检索到自己感兴趣的评论并展开讨论,或者避开无聊的撒泼耍浑式留言。

这是机器抢人饭碗的一个例子。

Image copyright David Davies/PA
Image caption 2016年里约奥运,《华盛顿邮报》的机器人记者包揽了大量数据密集型报道。
  • 《华盛顿邮报》:自动化新闻写作

“自动化新闻”(Automated Journalism)也称“机器人新闻写作”,使用的写稿软件是Heliograf。2016年里约奥运会上初次上场。它对源源不断的数据分析整理后,把信息跟事先定制的新闻模板里的对应词句配对,然后组成新闻稿,发表在不同的平台。要是发现数据里有异常,它还会提醒记者注意。也就是说,整个里约奥运会期间,写稿机器人承担了大量有关比分和奖牌数的实时报道,记者则可以更多采写其他内容。

新闻自动化有两层含义,一是数量,二是目标定制。

比如关于英国脱欧,机器人写手可以生成面向英国读者、中国读者或其他国际读者群的不同版本;关于股市动态的报道,可能会有一段专门为你订制:大盘总体向上,但你上周要是没有卖那些IBM股票,那你的投资组合资产今天会有这么多。

换句话说,机器人可以在万里之外写出比本地记者更接地气的新闻报道,或者把一条枯燥乏味的消息变成热搜榜上人人关注的新闻。

Image copyright Getty Images
Image caption 算法和机器学习在各行各业的应用进展迅猛,新闻媒体业也不例外。
  • 路透社:数据视觉化

路透社2016年跟语义辨识技术公司Graphiq合作,研发智能型的新闻发表软件,自带自由互动数据视觉化功能,涵盖范围宽泛多样,包括娱乐、体育和新闻等。这个发表软件可以在路透社开放媒体快捷平台调取数据。这些数据嵌入发表器网站后,数据世界化程序会实时更新。

  • 美联社:语义辨识、人工智能分析、自动化新闻

"自动化洞见"的另一个客户是美联社。早在2013年,美联社就开始运用人工智能来处理体育和财经数据,生成新闻稿。现在美联社的机器人叫NewsWhip,负责追踪、预测社交媒体平台上的趋势。除了跟踪新闻报道,它还可以向记者提供实时或历史时段的分析结果。有了这个助手,新闻稿的数据准确性提高,错误减少,记者编辑对新闻时事的把脉更精准。

美联社没有用人工智能来撰写长篇政治评论文章,但在用一款名叫Wordsmith的机器人来把盈利数据转换成财经新闻。

Image caption 机器人就隐身在电脑里。BBC的人工智能在数据库里纵横捭阖,整合海量的文字和音像资料。
  • Quartz数码新闻:聊天机器人媒体界面

关键词:聊天、自然语言处理、新闻、话题。Quartz2016年获得一笔资金设立机器人实验室,为记者们开发各种自动化工具。这是对新闻媒体行业大趋势的一种反应:新闻不但从纸面转到桌面电脑、手提电脑、手机,不久的将来还将通过物联网进入家庭和私人座驾。

简而言之,就是通过聊天、语音和其他新颖渠道来实现人机互动。这个尝试还在婴儿阶段,但已经可以看出端倪。用户输入问题和要求,比如新闻事件、人物或地点,聊天机器人根据自己的理解提供相关的内容。

Quartz的目标是开发出能够跟所有媒体平台流畅互动的机器人和人工智能。目前还没有最后确定下一步怎么走,但正在考虑的一些设想里包括一款编辑室机器人,帮助记者为新媒体空间编写新闻、生成数据。

英国《卫报》也引入聊天机器人,2016年在脸书帐户上亮相,主要工作是帮助读者选择阅读的版本、新闻推送时间,并负责推送;这职责明细看来跟客服比较相似。

Image copyright Getty Images
Image caption 机器有人力不及之处,也有不及人脑之处。

在中国写稿

自2015年腾讯财经频道开中国机器人写稿先河以来,不少媒体人发现多了个机器人“同事”。

2015年 -

  • 腾讯财经:9月10日发表了Dreamwriter新闻写作机器人编写的经济消息(《8月CPI涨2%,创12个月新高》)。
  • 新华社:“快笔小新”11月开始为体育部、经济信息部和《中国证券报》写体育赛事及财经消息稿件。

2016年 -

  • 网媒今日头条:“小明”(xiaomingbot)在2016年里约奥运会期间每天写30多篇赛事简讯和赛场报道;
  • 《钱江晚报》:微软旗下人工智能机器人“微软小冰”上岗,在“浙江24小时”APP中开设“小冰机器人”专栏;

2017年 -

  • 《南方都市报》凯迪网:与北京大学计算机科学技术研究所联合成立智媒体实验室,推出写稿机器人“小南”;
  • 《华西都市报》:机器人“小冰”开设专栏“小冰的诗”,独家发布新作《全世界就在那里》(外二首);
  • 《广州日报》:中国全国人大和政协两会期间,写稿机器人“阿同”、“阿乐”写出了政府工作报告热词分析、外交部部长记者会热点问题分析等多篇报道,还回复了公众关于两会知识的提问;
  • 《人民日报》:人工智能、语音机器人“小融”在春节期间上岗,在人民网和其他社交媒体平台与网友互动;

除了这些隐形的AI写稿程序之外,也有更全能、具备机器人形状的AI记者,如新华社的“i思”、《深圳特区报》的“读特”、浙江卫视的“小聪”和香港大公文汇传媒集团的“小宝”,可以出去采访和录制广播电视节目。

Image copyright Getty Images

取长补短

也许,未来比较合乎逻辑的延伸方向是人和机器各自扬长避短。机器人不以优美的文笔跟人竞争,而是在人的脑力无法企及的地方取胜,比如把一条重大讯息写成几篇视角独到、见解深刻、分析精辟的报道,而且能够迅速把这几篇文稿个性化,生成数十万个针对不同受众的版本。

AI在各地的编辑室里的职务明细正在不断变化,从数据收集、整理和分析、交叉查证核实,到写稿、创作、编辑,再到重新定义新闻传媒专业和行业,速度令人目眩。

新事物难免冲击现状,带来新问题,试管婴儿、克隆、基因编辑,无不在某些方面挑战人类社会伦理。AI也不例外。这是另一篇文章的话题。

更多有关此项报道的内容