您的当前位置:首页正文

文本挖掘工具,分享常用的文本挖掘工具分析步骤!

来源:华拓网
常用的文本挖掘工具分析步骤

说起发明这个事,廖可富称纯属偶然。他的发明全部来自生活中的灵感,比如带座位的行李箱就是他坐满乘客的候车室中因无座位有感而发。因此,他养成了一个习惯,随身携带一个本子,只要遇到生活中的灵感,就马上记下来,一有空闲,就琢磨创新发明。

ImageQ老规矩先确定文本语料!

确定语料:【武汉小伙廖可富是个爱发明的人,而他发明的灵感都是来自生活,因此他外出时经常拿着纸笔方便记录灵感。2016年,廖可富一共申请了16项发明专利,目前拿到了9项国家发明专利证书。】

ImageQ

一、打开ImageQ语义分析

常用的文本挖掘工具分析步骤

将需要进行语义分析的文本输入到文本框中,就能出现相关处理信息。

二、词性分析

词性分析:为每个分词结果中的单词标注一个正确的词性,确定每个词是名词、动词、形容词或其他

常用的文本挖掘工具分析步骤

三、词性比例

词性比例:对已标注的词性进行汇总,统计各个词性在文本中的所占比例。

常用的文本挖掘工具分析步骤

词性比例可以很直观的发现文本语料中词性的分布比例:

时间:0.18

标点符号:0.12

名词:0.18

其他:0.43

动词:0.24

四、实体识别

实体识别:利用人工智能,自动识别文本中具有特定意义的实体,主要包括人名、地名、时间、专有名词等。

常用的文本挖掘工具分析步骤

五、词云画像

词云画像:把从文本中智能抽取的信息以词云的形式进行展示,依词语显示大小来体现其重要程度。

常用的文本挖掘工具分析步骤

六、分类辨析

分类辨析:利用计算机对文本内容按照一定的标准进行分类,并用柱状图高低表示其权重。

常用的文本挖掘工具分析步骤

七、情感评分

情感评分:文本倾向性分析,机器判别人们的看法,对事物意见是积极或消极。

常用的文本挖掘工具分析步骤

情感评分:【2.41】文本语料属于:正面情感