当前位置 : 最新动态> 将文字变成图 直观了解新媒体运营数据
将文字变成图 直观了解新媒体运营数据
新媒体运营人最头疼的事情之一是数据分析,比如发布一个文章/视频,几百几万的评论中什么类型的评论占比多?一个一个去统计太难了,那怎么去看好与坏呢?当然我们可以用爬虫抓取所有的数据,那之后怎么做呢?
俗话说:“文不如字,字不如表,表不如图”,一张图的吸引力及可视化更强,更容易分析,比如这张图:
这张图是人人都是产品经理网站“产品经理”专栏所有文章标题制成的词云,通过这一张图就可以很清楚的看到,这个网站以“产品、经理、需求、互联网”为主。
这张图是电影“你的名字”豆瓣上所有的影评制作的词云,可以很清晰的看到主要评论重点是“少女,故事,剧情,画面,感动,穿越”等。
那么这张图到底该怎么制作呢?主要分成三大步:全部数据提取、数据处理、词云制作,如下图:
以下通过“你的名字”影评来详细讲解新媒体运营数据文本转图片
一、数据提取
首先我选择通过豆瓣电影来评测,数据提取有两个个简单易上手的方法:
第一个是利用爬虫,想要什么数据就去抓取什么数据,可以自己编写爬虫也可以用一些爬虫工具(集搜客花钱买),自己编写可以躲避封IP
第二个是采用新浪微舆情这个大数据工具,因而不用豆瓣的评论数据,在互联网上进行全网信息搜集,获取有关该影片的热门文章标题作为分析的文本数据,这种方法是比较轻松简单的,而且获取的是全网的数据,可以有选择性的选取自己需要的数据。
笔者是用Python编写爬虫来获取了豆瓣这部分的影评数据。
抓取后的数据整理成如下表格:
《你的名字》豆瓣影评数据
之后把文本数据单独取下来,全选“评论内容”这一列,把这些影评数据粘贴到记事本上,作为接下来分析的“原材料”。
二、数据处理
制作词云需要考虑关键词提取和词频统计这两个板块。
这里使用到的工具是热词分析工具---图悦(图悦使用方法)。将《你的名字》豆瓣评论的文本部分粘贴到上图中左边的文本框中,再点击右上方的“分析出图”,系统显示完成后,右边的预设词云会发生变化,此时点击“导出”,即可得到词频的csv文件。
经图悦处理得到的词频csv文件
这里去除词语和词频两列,用来进行接下来的词云制作。
三、词云制作
处理词云,笔者用到的工具是Tagul:
Tagul主页
(1)词频载入格式
在页面左上方的“Words”处,就是加载词语及词频的地方,这里需要注意一下它的载入格式。,如下表所示:
Tagul的词频载入格式
上表中,前两列的“Word”和“Weight”就是刚才经处理过的词语和词频,Color一栏则是设置该词语的颜色,这是个性化词云中很关键的一个要素,会直接影响到最终的词云呈现效果。这里可以不填写,那么在形成词云时默认随机生成颜色。如果要形成定制化的颜色,则需要设置采用16进制的色值,以下是常用的颜色代码表,即色值表。
常用的16进制色值表
与此类似,字体也可选可不选,需要定制的话,则可进行相应的设置。
“Repeat”这项则表示该词语是否会重复出现,填写“0”,则表示不重复,填写“1”,则表示重复。为了保持信息的精准度,减少噪声,一般选择填写“0”。
后面的URL链接就忽略了,因为有前面的设置,就不需要进行网页链接。
按照上述操作,出词语和词频两例外,笔者还定制了“Color”和“Repeat”这两项,结果显示如下。
最终的词语载入表
全选该表格的文字部分,将其粘贴到“Import Words”的文本框里,进行保存。
(2)载入中文字体
因为Tagul是老外做的一个在线词云制作网站,所以Tagul不支持中文,这需要我们载入能支持中文显示的字体,如下图所示,笔者载入的是“You Yuan(幼圆)”字体。
载入中文字体
(3)处理背景图片
加载了字体,可以说这是个性化词云制作的核心部分,词云最终效果的美与不美就在此一举。
值得注意的是,在载入图片之前的图片选取步骤时,需要选择背景和主题对比比较明显的图片。从接下来的图片预处理过程中,你会发现这一点的重要性。
词云自定义图片的初始状态
笔者选取的是《你的名字》最为标志性的一张海报,看起来很有感觉:既有男女主角的形象,也交代了他们所处的生活环境,中间则是影片中重要的提条线索---彗星。这张图初始状态看似杂乱,不好处理,但仔细观察,可以发现主体(男女主角)和背景(天空、城市和彗星)之间的对比度和色相差异还是很明显的。在Tagul的“Custom Shape”的设置中可以进一步处理背景和主体之间的对比度问题。
在“Shapes”处载入图片后,点击上载成功后图片的右下角“齿轮”,打开图片预处理。其中,“Threshold”处理景深,可以拉开/缩小背景和主体之间的差异;“Edges”则是处理主体轮廓的锐度,可以调节图片的清晰程度模糊程度。这里的要点是---淡化背景,清晰主体轮廓。
淡化背景,强化主体轮廓
好了,完成上面繁琐的步骤之后,现在是见证奇迹的时刻了,点击右上方大大的黑体字“Visualize”,待进度条加载完毕后,即可得到如下的最终效果图:
最终的词云效果图
以上是全部步骤了,在日常的新媒体运营中,善于运用工具会事半功倍。知家新媒体代运营,在每个时间节点对运营的数据情况都有精准的数据分析,通过数据来寻找接下来的运营方向,同时通过竞品数据分析,可以把握市场方向,特别是在抖音投放带货中更能体现如:
一个投放的达人,评论中什么占比高产品,达人本身,还是差评?如果评论数据很好但是评论的都是达人本身,那就要做做针对性的分析了,是达人不匹配还是什么,等等一系列的分析,有了词云效果图岂不是一眼就能看出来。