(编辑:jimmy 日期: 2024/11/11 浏览:2)
在原txt文件中,我们需要匹配出的字符串为:休闲服务(中间参杂着换行)
直接复制到notebook里进行处理
①发现需要拿出的字符串都在证卷研究报告前,第一步就把证券报告前面的所有内容全部提出来(包括换行)
②发现需要的字符串在两个换行符(\n)的中间,再对其进行处理
完整代码
import re txt = """ 行业报告 | 行业点评 休闲服务 证券研究报告""" result = re.findall(r"([\s\S]*)证券研究报告",txt)[0] sstr = re.findall("\n([\s\S]*)\n",result)[0].strip() print(" 匹配结果:",sstr)