基于TextRank的自动文摘和关键词提取

  • 发布日期:2019-09-29
  • 难度:中等
  • 类别:Web挖掘、文本挖掘
  • 标签:Python、pyhanlp、自动摘要、关键词提取、中文

1. 问题描述

基于pyhanlp,使用TextRank算法对中文文本进行自动摘要和关键词提取。

2. 程序实现

In [1]:
from pyhanlp import HanLP


document = '''面对近来长租公寓租金上涨引发的热议,
北京市房地产中介协会19日召开座谈会,
自如、相寓、蛋壳公寓等10家主要住房租赁企业负责人参加,
共同承诺落实「三不得」要求,
并承诺不涨租金且拿出手中共计超过12万套的全部存量房源投向市场。
为稳定租房市场,参会企业明确承诺不涨租金且拿出手中全部存量房源投向市场。'''

print(HanLP.extractKeyword(document, 2))
print(HanLP.extractSummary(document, 1))
[租金, 公寓]
[参会企业明确承诺不涨租金且拿出手中全部存量房源投向市场]