生活资讯
自然语言识别python_一个快速从自然语言文本中提取和识别关键短语的工具
2024-12-28 22:56  浏览:82

chinese_keyphrase_extractor (CKPE)

一个从 中文自然语言文本 中抽取 关键短语 的工具,只消耗 35M 内存

A tool for automatic keyphrase extraction from Chinese text.

本项目即将迁移至 jionlp 工具包,性能更好,速度更快哦~~~

应用场景 Application scenario

1.抽取关键短语

在很多关键词提取任务中,使用tfidf、textrank等方法提取得到的仅仅是若干零碎词汇。

这样的零碎词汇无法真正的表达文章的原本含义,我们并不想要它。

In many keyword extraction tasks, only a few fragmentary words are extracted when using tfidf, textrank and other methods.

Such fragmentary words cannot really express the original meaning of the article. We do not want it.

例如:

For example:

>>> text = '朝鲜确认金正恩出访俄罗斯 将与普京举行会谈...'

>>> keywords = ['俄罗斯', '朝鲜', '普京', '金正恩', '俄方']

我们往往需要更细化的短语描述,来作为文本的关键信息展示。这样的需求在生成词云、提供摘要阅读、关键信息检索等任务中都非常重要。

We often need more detailed phrase descriptions to display the key information of the text. Such requirements, namely keyphrases extraction, are very important in generating word cloud, providing abstract reading, key information retrieval and other tasks.

例如: For example:

>>> phrases = ['俄罗斯克里姆林宫', '邀请金正恩访俄', '最高司令官金正恩',

'朝方转交普京', '举行会谈']

2.扩展相关短语词汇

    以上就是本篇文章【自然语言识别python_一个快速从自然语言文本中提取和识别关键短语的工具】的全部内容了,欢迎阅览 ! 文章地址:http://sjzytwl.xhstdz.com/xwnews/820.html 
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 物流园资讯移动站 http://sjzytwl.xhstdz.com/mobile/ , 查看更多   
最新文章
SQL数据清洗:利用SUBSTRING和CHARINDEX处理无效字符
截取字符串 我们在做BI可视化之前,通常需要已经清洗干净的数据才能进行可视化分析。 随着电商的发展,有很多数据都
Python数据分析与展示
快讯:这是本课程第20次开课~~本课程是国家精品在线开放课程“Python网络爬虫与数据分析”的下半部分,欢迎大家加入学习!“我们
MacOS升级ruby版本
1. 历史与起源Bourne Shell (sh) ,即 Bourne Shell,是由 Stephen Bourne 在 1977 年开发的。它是最早的 UNIX Shel
SHOPYY:今天不聊亚马逊,我们只谈独立站
说到跨境电商平台,大部分人跟我一样,最先想到的就是亚马逊、eBay、速卖通、Wish这四大目前主流的平台。跨境电商卖家们借助平台
上外Blackboard在线建课问答第十二期(Q&A)
SISU上外Blackboard在线建课问答第十二期(QA)教师的个人课程列表中有一门《在线课程建设培训》,可自主学习相关资料。课程列表
uniapp开发H5拉起微信支付全流程(含H5获取用户code、openid方法)
这两天遇到一个需求就是开发微信公众号H5界面,需要点击支付按钮拉起微信进行支付。我自己觉得H5和小程序的支付流程还是有
一个月内三刷PB,吴艳妮发声
  澎湃新闻记者 祁东  仅用两周时间,吴艳妮又一次刷新自己的个人最好成绩(PB)。  吴艳妮一个月内三刷个人最好成绩。资
“用C语言实现计算功能”中,对比AI的程序,我的收获
最近写了一个用C语言实现计算功能的程序,已上传。运行截图:然后让文心一言也写了个程序:它只能计算例如3&#
【VS插件】学习笔记|AutoHistory:自动保存你的代码历史文件
你是不是曾经希望自己可以回滚一段你有修改过的工程的代码? 比如说,自己编写的一个程序原本是正常运行的、计算结
相关文章