词云,或者叫文字云,就是对网络文本中出现频率较高的“ 关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。沈浩老师曾在搜狐博客分享过一篇关于词云制作的文章,详细的描述了个性化词云制作的思路和工具。今天小兵也来学习一下如何用Tagxedo在线制作个性化词云。

在线制作词云工具介绍:Tagxedo词云 http://www.tagxedo.com。功能强大,可以对文字云的输入内容、形状、主题、字体等各种设置来达到想要的效果,而且完美支持中文。采用sliverlight渲染,优点在于可以自定义词云的形状,可以提取导入的文本或者Url内容的高频词作为构成元素,绘制个性化的词云。 1、在线制作的地址: http://www.tagxedo.com/app.html

2、装载词或词云:点击“Lold”按钮 提供三种方式,第一是调用文本文件,将事先处理完毕的关键词保存在文件中,直接读取;第二种是直接在中间的“webpage”框中输入一个含有主体性文字内容的网页地址,Tagxedo会自动提取分词进行绘制;第三种较为常用,即,直接在Text框中输入词和词频,最后点击Sibmit进行确认。本文采用第三种方式load以下内容(此次只复制7行,其他省略): 数据小兵 2697 数据分析师不是数羊的   156 因子分析 93 数据分析解决方案   65 数据分析 59 聚类分析 55 聚类分析案例  54 3、选择形状或者自定义图形:此处选择自定义 点击shape旁边的三角符号,可自行选择合适的图形。此次点击shape菜单底部的“Add Image”,加载自己的图片。然后通过调整“Threshold”和“Blur”两个参数值,将需要显示的图形到最佳,注意,黑色区域将被添加词云,最后确认。

4、重要参数调整: Layout Options,这步对中文很重要,主要是两个选项:Word选择Apply Nonlatin Heuristic设定No,这样就不会把中文分词(否则都是单词和内容分词了);Skip选择不需要的词或标签。

5、更改配送主题 如果你对默认配色不满意,可以点击theme右边的三角箭头,弹出了已有的配色主题,如果这些配色仍然不满足需求,可以点击右下角的add themes。 6、左侧的其他几个按钮 可根据实际情况进行适当调整,包括字体方向,轮廓的优化等。 7、保存: 左侧的Save按钮,可进行图片格式、大小等选择,甚至直接进行打印。沈浩老师观点:更愿意看到用词云制作的产品与原来有冲击力的图片进行PS拼接,一个人像的真实头像与词云的融合一体,可能更艺术。 现在来看看几个保存的效果:

主要参考: 1、沈浩老师博客: 词云可视化——中文分词与词云制作2、博客: 用Tagxedo制作文字云

来自: msnba  > 数据分析挖掘