python 利用jieba.analyse进行 关键词提取

(编辑:jimmy 日期: 2025/2/25 浏览:2)

1、简单应用

代码如下:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @File : jieba.analyse.py
# @Author: 赵路仓
# @Date : 2020/3/14
# @Desc : 提取关键字
# @Contact : 398333404@qq.com

import jieba.analyse


text='安全、防止水合物和段塞生成的重要措施之一。因此,针对未来还上油田开发技术,我们预先开展了水深1500米管道式油气水分离器的概念设计。通过该研究,提出适合海洋环境的体积小、重量轻、分离效率高、便于操作和维护的新型油气水三相分离器,使其成为海洋深水油气田开'
Key=jieba.analyse.extract_tags(text,topK=3)
print(Key)

python 利用jieba.analyse进行 关键词提取

2、含参使用

keywords = jieba.analyse.extract_tags(content, topK=5, withWeight=True, allowPOS=()) 
  • 第一个参数:待提取关键词的文本
  • 第二个参数:返回关键词的数量,重要性从高到低排序
  • 第三个参数:是否同时返回每个关键词的权重
  • 第四个参数:词性过滤,为空表示不过滤,若提供则仅返回符合词性要求的关键词

代码如下:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @File : jieba.analyse.py
# @Author: 赵路仓
# @Date : 2020/3/14
# @Desc : 提取关键字
# @Contact : 398333404@qq.com

import jieba.analyse


# 字符串前面加u表示使用unicode编码
content = u'安全、防止水合物和段塞生成的重要措施之一。因此,针对未来还上油田开发技术,我们预先开展了水深1500米管道式油气水分离器的概念设计。通过该研究,提出适合海洋环境的体积小、重量轻、分离效率高、便于操作和维护的新型油气水三相分离器,使其成为海洋深水油气田开'

keywords = jieba.analyse.extract_tags(content, topK=5, withWeight=True, allowPOS=())
# 访问提取结果
for item in keywords:
  # 分别为关键词和相应的权重
  print(item[0], item[1])

python 利用jieba.analyse进行 关键词提取

以上就是python 利用jieba.analyse进行 关键词提取的详细内容,更多关于python 关键词提取的资料请关注其它相关文章!

一句话新闻
一文看懂荣耀MagicBook Pro 16
荣耀猎人回归!七大亮点看懂不只是轻薄本,更是游戏本的MagicBook Pro 16.
人们对于笔记本电脑有一个固有印象:要么轻薄但性能一般,要么性能强劲但笨重臃肿。然而,今年荣耀新推出的MagicBook Pro 16刷新了人们的认知——发布会上,荣耀宣布猎人游戏本正式回归,称其继承了荣耀 HUNTER 基因,并自信地为其打出“轻薄本,更是游戏本”的口号。
众所周知,寻求轻薄本的用户普遍更看重便携性、外观造型、静谧性和打字办公等用机体验,而寻求游戏本的用户则普遍更看重硬件配置、性能释放等硬核指标。把两个看似难以相干的产品融合到一起,我们不禁对它产生了强烈的好奇:作为代表荣耀猎人游戏本的跨界新物种,它究竟做了哪些平衡以兼顾不同人群的各类需求呢?