简体 /  English
首页
知家业务
  • DTC整合营销全案
  • 社会化营销
  • 直播电商
  • 用户关系经营
  • 经销商赋能
服务案例
知家资讯
关于我们
联系我们
加入我们
知家文化
DTC研究院
  • 首页
  • 增长业务
    • DTC整合营销全案
    • 社会化营销
    • 直播电商
    • 用户关系经营
    • 经销商赋能
  • 服务案例
  • DTC研究院
  • 知家文化
  • 关于我们
  • 人才招聘
  • 联系我们
  • 简 /  EN

当前位置 : 最新动态> 将文字变成图 直观了解新媒体运营数据

将文字变成图 直观了解新媒体运营数据
发布时间:2022-05-29 10:05:06 阅读人次:2601

将文字变成图 直观了解新媒体运营数据

 

新媒体运营人最头疼的事情之一是数据分析,比如发布一个文章/视频,几百几万的评论中什么类型的评论占比多?一个一个去统计太难了,那怎么去看好与坏呢?当然我们可以用爬虫抓取所有的数据,那之后怎么做呢?

俗话说:“文不如字,字不如表,表不如图”,一张图的吸引力及可视化更强,更容易分析,比如这张图:

图片60.png

这张图是人人都是产品经理网站“产品经理”专栏所有文章标题制成的词云,通过这一张图就可以很清楚的看到,这个网站以“产品、经理、需求、互联网”为主。

图片61.png

这张图是电影“你的名字”豆瓣上所有的影评制作的词云,可以很清晰的看到主要评论重点是“少女,故事,剧情,画面,感动,穿越”等。

那么这张图到底该怎么制作呢?主要分成三大步:全部数据提取、数据处理、词云制作,如下图:

 

图片62.png

以下通过“你的名字”影评来详细讲解新媒体运营数据文本转图片

一、数据提取

首先我选择通过豆瓣电影来评测,数据提取有两个个简单易上手的方法:

第一个是利用爬虫,想要什么数据就去抓取什么数据,可以自己编写爬虫也可以用一些爬虫工具(集搜客花钱买),自己编写可以躲避封IP

第二个是采用新浪微舆情这个大数据工具,因而不用豆瓣的评论数据,在互联网上进行全网信息搜集,获取有关该影片的热门文章标题作为分析的文本数据,这种方法是比较轻松简单的,而且获取的是全网的数据,可以有选择性的选取自己需要的数据。

笔者是用Python编写爬虫来获取了豆瓣这部分的影评数据。

 

图片63.png

抓取后的数据整理成如下表格:


图片64.png

《你的名字》豆瓣影评数据

 

之后把文本数据单独取下来,全选“评论内容”这一列,把这些影评数据粘贴到记事本上,作为接下来分析的“原材料”。

二、数据处理

制作词云需要考虑关键词提取和词频统计这两个板块。

这里使用到的工具是热词分析工具---图悦(图悦使用方法)。将《你的名字》豆瓣评论的文本部分粘贴到上图中左边的文本框中,再点击右上方的“分析出图”,系统显示完成后,右边的预设词云会发生变化,此时点击“导出”,即可得到词频的csv文件。


 图片65.png

经图悦处理得到的词频csv文件

 

这里去除词语和词频两列,用来进行接下来的词云制作。

三、词云制作

处理词云,笔者用到的工具是Tagul:

图片66.png

Tagul主页

 

(1)词频载入格式

在页面左上方的“Words”处,就是加载词语及词频的地方,这里需要注意一下它的载入格式。,如下表所示:

图片67.png

Tagul的词频载入格式

 

上表中,前两列的“Word”和“Weight”就是刚才经处理过的词语和词频,Color一栏则是设置该词语的颜色,这是个性化词云中很关键的一个要素,会直接影响到最终的词云呈现效果。这里可以不填写,那么在形成词云时默认随机生成颜色。如果要形成定制化的颜色,则需要设置采用16进制的色值,以下是常用的颜色代码表,即色值表。


图片68.png

常用的16进制色值表

 

与此类似,字体也可选可不选,需要定制的话,则可进行相应的设置。

“Repeat”这项则表示该词语是否会重复出现,填写“0”,则表示不重复,填写“1”,则表示重复。为了保持信息的精准度,减少噪声,一般选择填写“0”。

后面的URL链接就忽略了,因为有前面的设置,就不需要进行网页链接。

按照上述操作,出词语和词频两例外,笔者还定制了“Color”和“Repeat”这两项,结果显示如下。

 

图片69.png

最终的词语载入表

 

全选该表格的文字部分,将其粘贴到“Import Words”的文本框里,进行保存。

(2)载入中文字体

因为Tagul是老外做的一个在线词云制作网站,所以Tagul不支持中文,这需要我们载入能支持中文显示的字体,如下图所示,笔者载入的是“You Yuan(幼圆)”字体。

 

图片70.png

载入中文字体

 

(3)处理背景图片

加载了字体,可以说这是个性化词云制作的核心部分,词云最终效果的美与不美就在此一举。

值得注意的是,在载入图片之前的图片选取步骤时,需要选择背景和主题对比比较明显的图片。从接下来的图片预处理过程中,你会发现这一点的重要性。


图片71.png

 

词云自定义图片的初始状态

 

笔者选取的是《你的名字》最为标志性的一张海报,看起来很有感觉:既有男女主角的形象,也交代了他们所处的生活环境,中间则是影片中重要的提条线索---彗星。这张图初始状态看似杂乱,不好处理,但仔细观察,可以发现主体(男女主角)和背景(天空、城市和彗星)之间的对比度和色相差异还是很明显的。在Tagul的“Custom Shape”的设置中可以进一步处理背景和主体之间的对比度问题。

在“Shapes”处载入图片后,点击上载成功后图片的右下角“齿轮”,打开图片预处理。其中,“Threshold”处理景深,可以拉开/缩小背景和主体之间的差异;“Edges”则是处理主体轮廓的锐度,可以调节图片的清晰程度模糊程度。这里的要点是---淡化背景,清晰主体轮廓。

图片72.png

淡化背景,强化主体轮廓

 

好了,完成上面繁琐的步骤之后,现在是见证奇迹的时刻了,点击右上方大大的黑体字“Visualize”,待进度条加载完毕后,即可得到如下的最终效果图:

 

图片73.png

最终的词云效果图

 

以上是全部步骤了,在日常的新媒体运营中,善于运用工具会事半功倍。知家新媒体代运营,在每个时间节点对运营的数据情况都有精准的数据分析,通过数据来寻找接下来的运营方向,同时通过竞品数据分析,可以把握市场方向,特别是在抖音投放带货中更能体现如:

一个投放的达人,评论中什么占比高产品,达人本身,还是差评?如果评论数据很好但是评论的都是达人本身,那就要做做针对性的分析了,是达人不匹配还是什么,等等一系列的分析,有了词云效果图岂不是一眼就能看出来。

 


上一篇:鸿星尔克C位出道!老品牌焕新,原来可以这样玩? 下一篇:聚焦母亲节营销:温情走心or出奇搞怪?
上一篇:鸿星尔克C位出道!老品牌焕新,原来可以这样玩?
下一篇:聚焦母亲节营销:温情走心or出奇搞怪?
热门文章
  • 01
    高溢价的jELLYCAT是如何款款卖到爆的?
  • 02
    品牌面面观 | 两年时间,徕芬如何从0到15亿?
  • 03
    抖音广告的“开屏广告”是什么?怎么样?
  • 04
    解密DTC |药食同源赛道里的营销玄学
  • 05
    知家 x 五菱发布首个《汽车行业超级用户运营白皮书》,探讨车企如何实现品牌突围
  • 06
    知家品牌拆解 | 探秘阿那亚如何通过用户关系经营实现长效增长?
  • 07
    好不容易有了粉丝, 一直播带货就掉粉怎么回事?
  • 08
    线上卖货有效指南,100种方法不如这一种!
  • 09
    揽月摘星 | 第 13 届金鼠标数字营销大赛得奖名单出炉,知家斩获 5 项大奖
  • 10
    诞生不到3年的完美日记,凭什么超越纪梵希?
推荐案例
五菱汽车
人民五菱上春晚
6
亿+
微博曝光量
12
w+
互动量
12
名
自然热搜
350
w+
抖音曝光量
案例详情 >
五菱汽车
IP竞技“冰雪萌力赛”
5
家
IP联合
66
+个
达人合作
1.2
亿+
曝光量
10
w+
评论互动
案例详情 >
热门标签
  • 私域运营营销
  • 超级用户运营
  • 用户口碑传播
  • 主题直播
  • 经销商赋能
  • 上市直播
  • 多平台直播
  • 短视频营销运营
  • 抖音短视频运营
  • DTC整合营销
  • 知家官方账号
  • 知家研究院账号
  • 知家文化
  • 知家文化
  • 企业文化
  • 品牌故事
  • 知家动态
  • 知家动态
  • 知家荣誉
  • 最新动态
  • DTC研究院
  • DTC研究院
  • DTC智库
  • 关于我们
  • 关于我们
  • 公司介绍
  • 联系我们
  • 加入我们

京ICP备 05012247号

京公网安备 34010402700146号 北京知家信息科技股份有限公司

  • 知家官方
  • 知家研究院
  • 友情链接:
  • 社会化媒体营销
  • 汽车直播电商
  • 用户运营
  • 经销商赋能
  • DTC营销
  • 知家DTC海外站
京ICP备 05012247号 京公网安备 34010402700146号 北京知家信息科技股份有限公司