蓝标要革写手的命?解密妙笔AI写稿机器人,一秒改编数千篇新闻稿
智东西(公众号:zhidxcom)文 | 心缘
近三年来,腾讯、百度、阿里巴巴、今日头条等一系列科技、媒体和资讯类企业都在机器人写稿方面展开布局,加速内容生产智能化的进程。如今,亚洲最大的营销传播公司蓝色光标也打造了自己的撰稿机器人“妙笔”,不过,和上述公司不同的是,它将AI应用的触角伸向了营销传播领域。
新媒体时代堪称信息爆炸的时代,大量繁杂的信息充斥着互联网,传统的营销传播方式正遭受挑战。“酒香不怕巷子深”已经不再适用,再好的品牌,几个月不宣传,也会被市场所遗忘。如何在人们眼前刷存在感呢?大量信息流的覆盖是最常规的传播手段之一。对于人类来说,针对某一事件为分散的平台写出多篇不同角度的稿件是一件费时又费力的事情,而妙笔机器人的产生正基于这一痛点。
妙笔机器人由蓝色光标集团子公司捷报数据研发,可基于一篇核心稿件,1秒内改编出数千篇中心内容相同而风格各异的新闻稿,以适配不同媒体平台的风格需求,解决传播生产过程繁复而耗时的问题,为内容多样性和个性化传播的快速实现提供可能。
就在刚刚过去的这个周末,蓝色光标一口气发布了14款AI领域的智能机器人,蓝色光标将此命名为“小蓝机器人家族”,这是营销行业内首款智能自动化人机交互产品族。其中,idataBot营销数据平台、撰稿机器人妙笔、发布机器人生花、鲁班一站式电商营销平台、麦集客等产品均为首次亮相。

近日,智东西与捷报数据总经理周登平以及北京大学计算机研究所教授、博士生导师万小军展开一场对话。在写稿机器人已经落地的大环境下,妙笔有着什么独特优势?又会对营销行业产生怎样的影响?对于这些问题,我们将一一揭晓。

三大核心技能,解锁传播类营销新做法
虽然与腾讯Dreamwriter、第一财经WritingMaster、百度度秘、今日头条Xiaomingbot以及南方都市小南同为撰稿机器人,也拥有相似的数据挖掘和自然语言处理等技术原理,但妙笔机器人的三大技能,使它与其他撰稿机器人在产品布局和应用领域有着本质的差异。

1、改编新闻稿
既然类属撰稿机器人,妙笔机器人第一大技能自然就是产稿了。据周登平介绍,捷报数据用三个月的时间给妙笔机器人“喂”了捷报过去积累的几千万篇新闻稿内容,使机器人学会拆解分析和改编文章。
妙笔机器人的改稿过程主要分为三步:第一步,输入原新闻稿标题和内容;第二步,机器对原文进行理解和分析;第三步,选择成稿数量,针对微信、微博和网易新闻的特性,在保证中心内容不变的情况下,改换不同风格的标题和内容,自动插入相关图片、商品链接、名词解释和延伸阅读。

随着功能的进一步补充,未来妙笔机器人的接口将拓展到今日头条、专业网站、平面媒体等更多不同风格类型的平台。

周登平告诉智东西,妙笔机器人改稿是建立在原稿基础上去修改一篇文章,这篇文章的核心内容不会被改编,更不会凭空杜撰,另外妙笔是从特定类型的新闻数据源学习改稿方式,不会学到娱乐、政治类新闻的成文方式,因此它很难出现大的错误。
2、借势热点,植入广告
妙笔机器人的第二大技能就是能快速整合信息和实现单点内容关联生成,可以根据需要传播的内容检索出适合做借势传播的热点。
人们在做营销传播时,有时会需要借助热点提振关注度。如果想要某一稿件被更多人看到,可以和其他话题性较强的相关新闻相结合。相比人工追逐热点的费时费力,机器人可以做到从海量文章中实时捕获相关热点并插入改变的文章中。

首先,用户输入多个关键信息点,妙笔机器人对分析主体、匹配图片、名词解释、定义标签等常用传播点进行分析,用户可以对妙笔的理解进行调整,在这之后,妙笔推荐出关键信息点匹配的热点新闻,并对原文内容的每个段落匹配进行分析,在合适位置插入热点新闻信息,从而成功“蹭”到热度。当然,对于机器人“写”得不够好的地方,用户还可以进行在线修改。
周登平举了一个例子,比如蓝色光标发布小蓝机器人家族时,妙笔机器人就借助了微软小冰第六代发布的热点:“微软小冰发布了机器人,蓝色光标作为亚洲最大的传播公司,也推出了一系列的机器人。”
3、结合其他机器人,发布、监测与优化
在改编完文章后,妙笔机器人可以和小蓝机器人家族的其他智能机器人进行合作,实现高效传播并不断优化模型。比如,它可以自动接驳到发布机器人(生花机器人)将批量文章一键自动发布到各个平台;它还可以结合情报来也舆情监测机器人对稿件进行实时跟踪监测,根据效果优化热点匹配模型。

数据、技术和应用是最大的武器
区别于其他写稿机器人,妙笔机器人在应用范围、数据来源、技术基础方面都拥有独特的优势。
1、应用优势:首个面向营销传播的机器人
BAT、京东、今日头条等公司推出的写稿机器人,基本上都用于自产内容。而作为营销传播公司蓝色光标的机器人,妙笔的核心价值在于解决客户的传播问题,即如何实现高效传播和全方位覆盖。蓝色光标的客户大多是五百强企业,需要向消费者传递信息,其业务场景和之前那些机器人不同,因而应用领域和服务范围会更广阔。
周登平表示,据他所知,妙笔机器人是中国营销传播行业的首个撰稿机器人。
2、技术优势:15年数据积累+深耕NLP技术
众所周知,对AI模型而言,语料库的充足至关重要,而捷报数据在数据和自然语言处理经验上已经有十余年的积累。捷报数据创立于2009年,是一家通过自主研发的数据分析系统向客户提供全方位专业数据服务的商业信息服务机构,其客户涵盖汽车、IT/互联网、消费品、金融、房地产等多个领域。
周登平告诉智东西,捷报的核心技术团队来自于北大方正,在过去的十多年间,捷报一直在做媒体数据的抓取和挖掘,尤其是大规模媒体类的自然语言处理,为两三百位商业客户提供媒体监测等服务,监测内容包括正负面传播、产品卖点、竞争对手、行业新闻等内容。
截至今日,捷报已经有将近50名算法工程师团队,120余名专业的数据分析人员在做自然语言处理相关工作。妙笔机器人能快速诞生,主要依赖于捷报过去十几年人工处理的标注数据积累。因为要为客户提供监测报告,包括内文图片在内的很多数据都经过人工标注和摘要,这些数据也经过正负面调性等因素的判断和清洗,这些人工标注的信息如今都成为了机器学习的重要素材。
即使有人获得了过去的数据,也依然难以撼动捷报在数据方面的优势地位。捷报的数据是动态的,目前有一百多个员工在服务几百位客户,每天都在产生大量的经过人工标注的稿子。妙笔机器人是基于循环神经网络(RNN),这种神经网络的优点是和时间有关联性,只要为最新的样本设置更大的权重,就能让机器更熟悉和擅用最新的套路,从而使妙笔机器人在数据的迭代中不断进化。
捷报长期的数据积累加上不断迭代的数据都不是其他任何一家公司朝夕之间可以拥有的,这使得妙笔机器人拥有很强的竞争力。没有足够数量和正确标注的数据去学习,其他公司的算法做的再好也很难训练出好的AI模型。
3、专家支持:和北大教授万小军合作
北京大学计算机研究所教授、博士生导师万小军是机器写稿领域的知名专家学者,今日头条、南方都市报的机器人背后,都离不开万教授的支持。万教授介绍到,在他之前参与的写稿机器人研发中,他们会直接提供代码,而蓝色光标拥有自己的算法工程师团队,他更多是传授一些算法经验和提供技术咨询服务。
捷报数据拥有海量经人工标注的数据,而万小军教授研究自然语言处理、文本挖掘和人工智能领域最先进的算法,用捷报的数据跑万老师的算法,既可以帮助万老师将其算法调到一个更佳的状态,又有助于优化妙笔机器人的性能。

撰稿机器人的行业价值
基于营销传播的妙笔机器人是AI赋能传统行业的又一实例,随着算法的日臻完善,以它为代表的撰稿机器人将成为人类写手的优秀助手,在提升效率、降低成本的同时,进一步解放人类的劳动力。
1、提高效率,助力品牌传播
妙笔机器人最关键的价值就在于提升效率,更好服务客户。传统的营销传播需要大量人力来从事写稿、改稿类的工作,这个过程往往会很耽误时间。而如果只是简单摘取文章内容进行发布,那么每篇稿子的相似度太高,就缺乏针对性。
对于改稿机器人而言,最有价值的指标就是速度。目前妙笔机器人能做到1秒钟生产数千篇文章,产稿所需时间不到原来人工所需时间的5%,很大程度上提升新闻时效性和发稿效率。而这些文章的风格各不相同,可严谨、可活泼、可具体、也可搏眼球。这种根据众多平台特点进行个性化定制服务的打法,可以迅速提高内容阅读量,这是人类短时间内很难做到的。
此外,妙笔强大的数据挖掘能力和信息整合能力,使之能更加精准的抓住传播要点,并实时借势相关热点新闻,从多方面帮助客户高效地创造更多的品牌价值。
2、节约成本,解放人力
据周登平说,借助AI技术,妙笔机器人可以节省90%的改稿人力,将员工从大量繁复的数据收集和整理等没有技术含量的基础性业务中解脱出来,节约员工的时间和精力去从事沟通、创意类的工作。这不仅能节省时间成本和劳动成本,还能激发营销人的创造力。
3、未来应用范围将更广泛
透过当下的撰稿机器人,周登平还谈及一些未来有望成为现实的机会和商业模式。他表示,捷报的下一步战略有可能是让机器人去帮助自媒体选择内容,把自媒体内容的获取和改写过程机器化,然后将客户想要传播的信息和自媒体的文章做结合,自动生成一篇文章发出去。
此外,虽然现在撰稿机器人主要是根据客户需求,未来机器撰稿可能会结合用户需求形成与职业信息、商业相关的定制方案,提供消费者想了解的信息。
万小军也补充道,除了编撰和改写新闻稿,撰稿机器人在讲话稿、咨询报告、气象局和医疗机构的文件等诸多领域都大有可为。

机器人写稿还有大山要翻
目前,撰稿机器人仍然存在很多局限性。大多核心工作,仅靠机器是无法完成的,就改稿工作而言,妙笔机器人也还做不到完全自动化,尚需要一定的审稿、选稿等人工干预。周登平表示,妙笔机器人现在改的稿件也做不到100%完全的流畅,少量改完的传播稿件有的语句读起来会有些生硬,在通顺度的提升方面还有进步空间,但他同时强调机器人在这方面的进步速度也是惊人的。
另外,从现在的技术发展来看,如今实现的还是基于人类原稿的修改,AI自主文体创作还没有产生让人耳目一新的作品。万小军还介绍到,自动评价和迁移学习也是机器人写稿需要攻克的难题。机器只能接近人类评价的结果,但不能取代人类评价;而迁移学习的难度在于娱乐、体育、财经、汽车等每个领域写作方式和处理数据的方法都不一样,如何在标注的训练样本数量有限、数据分布变化的情况下进行模型迁移是一大亟待解决的问题。

结语:行业缺口已打开,机器写作未来可期
随着大数据、云计算和AI算法的快速突破,AI落地场景愈加丰富。在这短短三年间,腾讯Dreamwriter、新华社快笔小新、第一财经DT稿王、今日头条Xiaomingbot以及蓝色光标的妙笔机器人等撰稿机器人在我国先后问世,逐步代替了传统新闻编撰的基础工作,AI+内容生产的应用领域已经初见成效。就在本篇专访即将发布之前,记者在网上搜索了“妙笔机器人”,已经看到了妙笔机器人为自己改编的传播稿。

▲百度上搜索到的妙笔机器人改编稿
然而,现阶段机器撰稿还不能称之为真正的写作。机器撰稿不仅存在通顺度等问题,对信息的提炼和概括能力有待继续提高,在思考和创作能力上也远远达不到人类的高度。不过,随着自动语言处理技术的迅速发展和未来各平台间的不断开源,AI可能会逐渐克服上述难点,再加上和视音频以及VR/AR技术的融合,未来撰稿机器人的发展将有无限可能。
在你下一次随意浏览行业新闻资讯时,或许那篇文章就出自AI之手。
一个月生产500多篇,《华盛顿邮报》的机器人是如何写稿的?
《华盛顿邮报》的人工智能机器人一个月独立“写”了500多篇文章,吸引了50多万点击量。它是如何写稿的?记者将会被取代吗?
文/Joe Keohane 编译/李薇濛
图文编辑/丁林 新媒体编辑/吕冰心
太长不看版:
1、《华盛顿邮报》机器人Heliograf代表了目前新闻业最先进的人工智能水平
2、在美国大选报道中,编辑为故事创建“叙事模板”,写入能够解释各种可能结果的关键短语,把Heliograf挂靠到某个结构化数据源上,匹配合并后生产出稿件
3、使用机器人的目的是为了提高记者效率,而不是取代记者
4、机器人写稿仍有缺陷,比如它不太会识别假新闻
去年11月,在爱荷华州第4届国会区席位的选举中,当共和党人Steve King击败民主党人Kim Weaver时,《华盛顿邮报》雷厉风行地报道了选举的赢家,并谈到了更广泛的选举趋势。该文章写道:“共和党人保留了对众议院的控制权,他们所控制的多数席位仅有少量损失。很多‘大老党’(注:指共和党)领导人曾担心会损失两位数的席位,但运气发生了令人惊讶的逆转。”显然,这篇文章具有《邮报》一贯的、清晰热情的写作风格。
不过,它有个非常关键的独特之处:它是由机器人Heliograf生成的。2016年才在《邮报》网站上首次亮相的Heliograf,标志着迄今为止新闻业最先进的人工智能水平。
其他3种AI新闻工具
1.WIBBITZ
《今日美国》利用这款AI制作短视频。它可以将新闻文章凝练为脚本,把图片和视频剪辑在一起,甚至还能用合成的语音进行新闻播报。
2.NEWS TRACER
路透社的这款算法能帮助记者判断某些“推特”消息的真实性。该AI会评估消息的传播者,以及消息在网络上的传播方式,分析附近的用户是否在推特上给予了确认或否定的反馈,最终基于“可信度”和“新闻价值”为消息评分。
3.BUZZBOT
由BuzzFeed开发的这款软件最初用于共和党、民主党全国大会的“众包式”报道。不过,它现在已经改从新闻现场收集信息。BuzzBot目前已经开源——这预示着一大波机器辅助报道工具即将出现。
◆◆◆
《邮报》AI如何写稿?
2013年,当杰夫•贝索斯(亚马逊CEO)买下《邮报》时,AI新闻还处于起步阶段。当时的几家具备自动内容生成系统的公司(如Narrative Science和Automated Insights)已经能够生成体育新闻、股票消息等陈述简单、数据丰富的新闻。
但是《邮报》的战略分析师认为:AI应该有潜力写出见解更加深刻的文章。而且,他们还想让AI在人-机之间实现“无缝互动”,随着时间推移,最终让故事“进化”出来。经过几个月的开发,Heliograf终于亮相。它最早发布的是一篇关于奥运会的新闻。
△大选日程、比赛结果等消息完全可用模板来“写作”(来源:华盛顿邮报)
很快,Heliograf又更新换代——这个带有更强社论语气的版本负责跟踪美国大选报道。新闻发布流程如下:
1. 编辑为故事创建“叙事模板”,写入能够解释各种可能结果(不外乎“共和党人保持对众议院的控制”以及“民主党人重获对众议院的控制”)的关键短语;
2. 把Heliograf挂靠到某个结构化数据源上。例如,在报道选举时,就使用VoteSmart.org(汇集了官员、候选人、立法、选举等的翔实信息)提供的数据;
3. Heliograf识别相关数据,并将数据与模板中的相应短语进行匹配、合并,然后在不同平台上发布不同的版本;
4. 此外,系统还可以通过Slack工作平台,警告记者在数据中发现的任何异常(例如,数据超出了预测范围),以便记者调查。
△通过大量历史数据的调用,AI甚至可以在比赛解说中谈笑风生(来源:Medium.com)
◆◆◆
AI为记者代劳“搬砖类工作”
《华盛顿邮报》采用人工智能写稿有两个主要目的:
第一:增加受众。与其让一些记者加班加点地赶几篇热点稿来满足大批人群,不如通过大量自动生成的“短新闻”不断吸引零散受众。或许关注“爱荷华州国会选举”这种新闻的人并不多,但是总会有人想看。在本地新闻媒体焦头烂额的时候,《邮报》却可以轻松应对。
第二个目的,是帮助记者提高工作效率(而非大家所说的“取代记者”)。在Heliograf的帮助下,有经验的记者们不必再实时关注比赛结果和永无休止的民意调查,从而可以把精力腾出来,集中在真正需要人脑的地方——如果让一位有30年新闻经验的记者去写一个用模板就可写成的故事,简直是对人才的巨大浪费。
△新闻机器人能显著提高记者的工作效率(来源:TechCrunch)
到目前为止,《邮报》记者们对于这位新来的“机器同事”写稿依然抱乐观的态度。“对于任何可能取代人类的技术,人们自然会保持警觉。但是这项技术似乎只是接替了一些低级的工作。”一名记者如是说。
2012年11月,4名记者花了25个小时才整理并发布了一部分选举结果——到了2016年11月,Heliograf在没有人为干预的情况下“写出”了500多篇文章,并由此吸引了50多万的点击量。虽然与《邮报》当月11亿的点击量相比,这个数字只是九牛一毛,但它毕竟还有很长的路要走。
◆◆◆
新闻AI的未来:实时更新稿件、自动组稿
在《邮报》从事战略开发的Jeremy Gilbert表示,他们计划下一步利用Heliograf即时更新人工和机器撰写的稿件。例如,有人分享了一篇两天前写好的稿件,但在这两天里,所报道的事件已经有了新进展,Heliograf就会自动更新报道内容。如此,它的审校功能可以得到充分利用:记者收集信息,写一些零散的事实和分析,再把内容交给系统去整合即可。
《邮报》首席信息官Shailesh Prakash相信,随着日益廉价的硬件推动AI技术迅速发展, Heliograf有朝一日将能胜任更高级的工作:它可以搜索网络、发掘热点,并检查《邮报》网站上是否已经发布了搜索到的消息——如果消息还未发布,它可以提醒编辑,或者干脆自己写新闻。
△人工智能的信息搜索效率远非人类可比。图为人工智能“沃森”参加智力问答节目(来源:美联社)
不过,AI的“采写”能力还有缺陷。去年Facebook曾解雇了所有的热门话题编辑,把他们的工作全部交给机器算法处理。但是仅过了3天,一条“主播Megyn Kelly因力挺希拉里而被福克斯新闻解雇”的假新闻就蹿上了头条。
和其他主流新闻媒体一样,《邮报》目前也在寻找新的收入来源。他们正准备将内容管理系统授权给Tronc财团(旗下有《芝加哥论坛报》《洛杉矶时报》及数十种地方性报纸)。
随着新闻媒体的资源越来越有限,不难想象,AI将接手越来越多的内容创作任务——对记者和读者来说,这是不是一个好消息?那就是“另一个新闻”了。
注:编译自美国 《连线》3月刊,原文作者Joe Keohane是位人类
(本文由北京科技报全媒体中心编辑制作,转载请联系授权:bjkjbeditor@163.com,违者必究)
阅读更多权威有用的科普文章、了解更多精彩科技活动,请下载“科学加”客户端。苹果用户可以在App store搜索“科学加”下载安装,安卓用户可以在应用宝、360手机助手、豌豆荚、华为、小米等应用市场搜索“科学加”下载安装。
加入北京科技报(全职/实习)
bjkjbhr@163.com
投稿或推荐选题
bjkjbeditor@163.com
相关问答
人工智能写稿终能代替人类写稿吗?
多谢邀请回答:个人认为,目前人工智能还不能彻底代替人类写稿其中最重要的原因就是人工智能不具备感性思维,无法跨越到意识领域。当前的计算机架构和编程模...
写稿机器人正飞速成长,人工智能将如何改变媒体业?
不用机器人写稿,人工智能也彻底改变了传统媒体的生态。以今日头条为例,在互联网、大数据、云计算支撑下,通过机器算法和智能搜索,建立起自媒体平台,让众多传...