基于Jieba和Pyecharts做新闻关键词分析与可视化

Pyecharts是一个用于生成Echarts图表的Python类库,而Echarts则是百度开源的数据可视化JS库。结合Jieba这款优秀的中文分词库,我们可以方便地在Python中进行数据处理和生成图表,实现新闻关键词的分析与可视化。

首先,确保你已经安装了Pyecharts和Jieba库:

pip install pyecharts jieba

接下来,使用以下详细代码对新闻文本进行关键词提取和统计,并生成柱状图进行可视化:

import jieba import re from collections import Counter from pyecharts.charts import Bar # 读取新闻文本 cut_words = "" for line in open('text', encoding='utf-8'): line.strip('\n') line = re.sub("[A-Za-z0-9\'\:\·\—\,\。\“ \”\n\u3000\?\、\'*\',\']", "", line) seg_list = jieba.cut(line, cut_all=False) cut_words += (" ".join(seg_list)) all_words = cut_words.split() # 统计词频 c = Counter() for x in all_words: if len(x) > 1 and x != '\r\n': c[x] += 1 print('\n词频统计结果:') keyword_dict = {} for (k, v) in c.most_common(10): # 输出词频最高的前10个词 keyword_dict[k] = v print("%s:%d" % (k, v)) # 生成柱状图 key_list, value_list = [], [] for k, v in keyword_dict.items(): key_list.append(k) value_list.append(v) bar = Bar() bar.add_xaxis(key_list) bar.add_yaxis("新关键字统计", value_list) bar.render()

在运行以上代码后,你将得到一份关键词统计结果,并生成对应的柱状图进行可视化。

图片[1]-基于Jieba和Pyecharts做新闻关键词分析与可视化-山海云端论坛
图片[2]-基于Jieba和Pyecharts做新闻关键词分析与可视化-山海云端论坛

如果需要更多关于Pyecharts的信息,可以查阅Pyecharts文档,Jieba的更多细节可以在其GitHub页面上找到。通过这些工具,你可以轻松地进行中文文本分析和数据可视化。

© 版权声明
THE END
喜欢就支持一下吧
点赞6 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容