今日头条实验室发布2017中国人数据使用报告

2017-12-26 04:49

  13世纪,法国的讣闻、甚至鲜葡萄酒上市的消息都依靠口头,这是当时欧洲最主要的新闻方式,直到15世纪,古登堡印刷术的出现让大规模的文字成为可能。文字这种记录方式让新闻客观性得到了大幅提升。到了互联网时代,虽然文字依然是新闻最主要的表达形式,但一种更为抽象的信息表达形式正在新闻界普及——数据。

  在过去的几年间,大数据逐渐从一个热门概念落地为可进行商业变现的具体业务。无论是互联网公司还是传统企业,都在迎接数据带来的改变,行业也不例外。如同百年前印刷新闻的普及、采访报道方式的出现一样,数据的使用为新闻报道带来了新的可能性,如果我们把视野放宽,数据不但在影响机构的专业新闻生产,也在影响自人的内容创作。数据既成为一种内容表达形式,也是辅助内容创作的一种工具。

  今日头条实验室此次联合新京报传媒研究、刺猬、蓝媒汇共同发起了2017年中国人/自人数据使用调查。我们希望通过本次调研,共同探讨数据这一正在兴起的信息表达形式对于内容创作者的意义,从中看到人的创作方式正在发生哪些转变,在此过程中,他们如何处理数据与新闻伦理之间的关系。

  在我们的调研中,我们把数据定义为两种,一种是为内容提供素材,为新闻报道提供线索的数据,如宏观经济数据、股票数据等,另一种是内容过程中产生的用户数据和舆情数据,帮助内容创作者贴近用户需求。

  本次调研采用线上问卷调查(问卷星)和线上线下两种形式,问卷派发通过头条号平台和微信平台进行,对人共收到587份有效问卷,对自人共收到1218份有效问卷。线人。

  本调查所指机构人包括纸媒、电视以及传统旗下新,不含商业营销公司。自人以头条号创作者为主。

  我们的问卷调查显示,在受访的人和自人中,95%以上的人认为数据对于新闻创作重要或者非常重要。

  需要进一步追问的是:这种重要性从何而来?受访对象中,54%的人和56%的自人数据最能产生的效果是“掌握读者/用户信息,优化推广”,该选项占比最高;其次是“为内容提供素材,内容质量提升”,选择该项的人和自人分别在各自群体中占比38%和39%。

  为了更好地利用数据,人和自人认为最重要的因素是数据源,分别占比50%和54%,其次是技术能力,分别占比21%和26%。另外,相比自人,人更看重其中人才因素,人中选择该项的比例比自人高出6个百分点。

  新闻业既往富含有质感的现场描述和观点表达,但往往过于欠缺量化的数据支撑,大数据的浪潮得以让新闻更加和可信。人作为最先能触摸到时代和技术脉搏的一个群体,应该更积极的去接纳这个新技术新领域,互联网短暂却的发展史一直在教育我们,历史潮流不进则退。

  准确的数据是记者把握问题、理解问题的基础,记者在报道事件时,有数据作为支撑,是最好的表达选择之一。很多优质报道都是基于数据来获得基础材料,从而得出更全面、准确的结论。

  《新京报》的很多报道都涉及数据,也开设有相关的数据新闻栏目。在移动互联时代,报道中恰当地利用数据会让信息简明直接,易接受,易。至于阅读反馈等相关数据,可以让我们更好地了解受众的阅读偏好,使用习惯等,也可以让我们制作的内容更有针对性。

  数据作为对客观事实的逻辑归纳,意味着更为精确的内容。数据已不再是数据新闻团队专属的创作素材,对于普通记者来说,使用数据进行报道正在成为一种新闻操作习惯。通过数据的汇总和分析,个案之间的潜在关系被重新组织,从中挖掘出新闻线索,这是普通采访所无法达到的。

  人和自人使用数据已经十分普遍,有27%和33%的受访人和自人形成了较为稳定的数据使用习惯,其数据使用频率在每周三次以上。有38%和40%的人和自人不定期使用数据。

  人的专业背景与数据使用频率之间没有显著相关,自人的专业背景与数据使用频率之间存在显著相关。其中,社会科学、工科背景的自人数据使用频率更高。

  人的从业年限与数据使用频率之间没有显著相关,自人的从业年限与数据使用频率之间存在显著相关。其中,2年以上从业经验的自人相对于2年以下从业年限的自人数据使用频率更高。

  对于不同领域的数据,人和自人的数据需求呈现出差异:在人最希望获得的数据类型中,占比前三的依次是行业数据、自身读者/用户数据和舆情数据,而在自人中,占比前三的依次是自身读者/用户数据、行业数据和宏观数据。相较于机构人,自人对于舆情数据的程度更低,而对于自身读者/用户数据的程度更高。

  受限于平台影响力、公信力以及资源积累等因素,自人在进行外部数据公司合作时出现明显劣势。直接从数据方获得数据的方式在自人中占比24%,低于人19个百分点;有61%的自人与外部数据公司没有过合作,高于人16个百分点。

  对此,我们了几位有代表性的人、自人和数据公司从业人员,看他们在进行数据合作时主要考量哪些因素。

  澎湃的运营团队会与数据公司合作,但我们的角色主要是作为产品需求方,通过数据去了解我们的产品定位,做数据输出的业务还比较少,在筹划中。

  我们平时会看今日头条实验室、微博指数、搜狗指数、百度指数的数据。但目前没跟大数据公司合作过,也没找到这方面的渠道。数据使用过程中遇到的比较大的问题是:我们会简单使用数据,但不够规范和专业,缺少同行交流和学习。

  极海前期与合作形式主要分为两种:一种是内容合作,极海提供数据及可视化支持。例如与、界面新闻、今日头条等合作的数据新闻;另一种则是市场活动合作,例如线下沙龙、行业比赛等。无论是传统还是自,极海非常愿意与大家一起用地图传递数据价值。

  合作时,首先考虑的是合作内容是否符合极海定位。其次希望能够通过长期的合作为社会生产生活、行业发展带来帮助。

  Excel是人和自人最普遍使用的数据工具,两个群体使用不同数据工具的比例相差不大。Python、R两门编程语言在两个群体中的使用比例较低。两个群体都有50%左右的人有学习相关数据技能的打算,但不知道从何学起。没有学习数据技能打算的人在人和自人两个群体中分别占比29%和27%。

  数据技能短板不仅是中国人面临的困境。Google News Lab针对全球记者的调研显示,对于“什么因素在阻碍新闻人的数据使用”的问题,选择“缺乏数据分析能力”的受访对象占比最高,达到32%。

  数据新闻在中国已经不是一个陌生概念。从2011年开始,中国门户网站率先进行了数据新闻尝试 ,此后,包括、、财新等都开始了数据新闻尝试。经过近几年的发展,中国的数据新闻作品在数据挖掘、信息设计、前端可视化等多方面都出现了明显提升,逐渐与国际接轨。

  在受访人中,表示所在机构有建立数据新闻团队的人占比32%。对于中国来说,尽管出色的数据新闻团队已经涌现,但建立数据新闻团队仍不是普遍现象。

  数据新闻涉及新闻选题经验积累、数据挖掘与分析、数据可视化、前端交互等多方面工作,大部分时候由团队完成数据新闻作品。但另一方面数据新闻作品的量相较于文字并没有明显优势。保持一支数据新闻团队的运作对来说是一笔不小开支。那么,中国是如何面对这一困境的呢?我们对中国较为典型的几家的数据新闻团队进行了,从中比较各个团队在运作上的差异和共性,尤其是在营收模式上有何特点。

  本部分对象分别为第一财经旗下DT财经主编王小乔,第一财经旗下新一线城市研究所主编沈从乐,澎湃新闻美数课负责人吕妍,南方都市据新闻工作室负责人邹莹。

  移动设备正在成为最重要的媒介载体之一。据中国互联网信息中心(CNNIC)统计,截至2017年6月,中国手机网民规模已达7.24亿,手机上网人群在网民中占比96.3%。 基于电子媒介,人的阅读行为已经被广泛而准确地记录,变化和新闻热点变化可以通过数据被更加细致地呈现。在此基础上,用户对不同新闻题材的关注度也开始反向影响的议程设置。舆情数据已经成为人、自人的重要参考依据,阅读量等数据指标也成为效果量化的重要指标。

  生产出一篇刷屏的作品可能会让内容创作者兴奋不已,但对于新闻生产者来说,专业的新闻叙事和效果之间存在矛盾吗?我们对一些新闻从业者进行了,介绍在他们的日常新闻实践中,如何处理新闻作品的数据表现、记者考核与新闻专业主义之间的关系。

  对于数据新闻作品,阅读量不是唯一目的,我们希望部分产品能影响有影响力的人群。

  毫无疑问,在新闻人眼里,新闻伦理是第一要义,新闻的数据表现及其背后代表的商业利益是第二要义。但这两者之间有一个平衡点和界限,这个界限在每个实际操作者的手中和心中。用数据评判记者和编辑的工作存在很多不合理之处,但目前也没有比它更合理的工具。综合读者评价、业内评价也许能一定程度修正其不合理之处。

  我们内容部门还是思考内容价值,我们不太从经营的角度思考问题,否则长期下来内容与经营的界限就会很模糊。采编与经营之间是有防火墙的。我们会看数据,但不会特别根据这些数据来调整选题。现在很多爆点选题并没有可复制性。

  一方面肯定要生产有公共价值的内容,这是职能所在,另一方面也要生产高流量、高阅读量的内容,去笼络更多的用户。本质上是不矛盾的,有更多用户后就有更大的影响力,所生产的有公共价值的内容才会更能发挥作用。

  阅读量我们会很关注,毕竟流量时代。但阅读量不是衡量记者工作的主要指标,比如有的选题比较复杂,复杂、专业的东西看的人自然少。评价记者工作主要还是看劳动时间。

  我们会关注阅读量,但这并非是我们关心的唯一数据。作为传统,责任仍然是第一位的。我们首先需要新闻专业主义,当然,我们会根据数据反馈的情况适当调整内容的表现形式,让受众更易接受。但对待严肃新闻,比如揭黑报道,我们的表达就必须符合专业、、客观、平衡、逻辑严谨等这些报道原则,而不能被阅读数据所左右。

  在今天的技术背景下,生态正在发生重要变革,技术不断重构内容生产、平台分发和受众消费三者之间的关系。数据在界的广泛应用只是其中的一个议题。未来,今日头条实验室将持续关注转型及内容业创新,为大家带来更多前沿资讯及研究,并依托实验室产品,为内容创作者提供数据服务。欢迎关注。