【python】提取文章句子中的,开头与结尾的两个中文字符。

原创 2018年04月15日 17:03:55
参考:

【python】正则表达式,提取句子开头两个字

    正则表达式在线生成工具

---------------------------------------------------------------------------

>>> end = re.compile(r'[\u4e00-\u9fa5].$')
>>> start = re.compile(r'^[\u4e00-\u9fa5].')
>>> with open('E:/000.txt','r')as f:
...   for line in f:
...     s = start.search(line)
...     e = end.search(line)
...     print(s&e)
...
Traceback (most recent call last):
  File "<stdin>", line 5, in <module>
TypeError: unsupported operand type(s) for &: '_sre.SRE_Match' and '_sre.SRE_Match'
>>> with open('E:/000.txt','r')as f:
...   for line in f:
...     s = start.search(line)
...     e = end.search(line)
...     print(s,e)
...
<_sre.SRE_Match object; span=(0, 2), match='美国'> <_sre.SRE_Match object; span=(3, 5), match='序言'>
None None
None None
None None
None None
<_sre.SRE_Match object; span=(0, 2), match='我的'> None
<_sre.SRE_Match object; span=(0, 2), match='这一'> None
<_sre.SRE_Match object; span=(0, 2), match='我还'> None
<_sre.SRE_Match object; span=(0, 2), match='经院'> None

-----------------------------------------------

两个重要网站,第一个可视化正则表达式

http://tools.jb51.net/regex/javascript

第二个各种不同语言的写法

http://tools.jb51.net/regex/create_reg


-----------------------------------------




参考:https://blog.csdn.net/qq_19741181/article/details/79360473

-----------------------------------------------------------

参考:去掉空白格 http://www.iplaypy.com/sys/s95.html

>>> with open('E:/000.txt','r')as f:
...   for line in f:
...     line.strip()
...     s = start.search(line)
...     e = end.search(line)
...     print(s,e)
...

-----------------------

>>> with open('E:/切图.txt','r')as f:
...   for line in f:
...     l = line.strip()
...     s = start.search(l)
...     e = end.search(l)
...     print(s,e)
...
<_sre.SRE_Match object; span=(0, 2), match='切图'> None
None None
<_sre.SRE_Match object; span=(0, 2), match='广东'> None
None None
<_sre.SRE_Match object; span=(0, 2), match='粤教'> None
None None
<_sre.SRE_Match object; span=(0, 2), match='广东'> None
None None



正则表达式:检查一个句子或者字符串是否以大写字母开头,以句号结尾.

regex 正则表达式
  • JQ_AK47
  • JQ_AK47
  • 2016-06-14 12:13:32
  • 5481

编写一个正则表达式:检查一个句子是否以大写字母开头,以句号结尾.

package 正则表达式; import java.util.regex.Pattern; public class Test2 { public static void main(Strin...
  • u012110719
  • u012110719
  • 2014-11-09 22:05:21
  • 4879

轻松python文本专题-字符串开头或者结尾匹配

场景: 字符串开头或者结尾匹配,一般是使用在匹配文件类型或者url 一般使用startwith或者endwith >>> a='http://blog.csdn.net/raylee2007' >>...
  • raylee2007
  • raylee2007
  • 2015-08-27 21:58:20
  • 7008

python 匹配字符串开头和结尾

python 匹配字符串开头和结尾
  • qq_29422251
  • qq_29422251
  • 2017-09-01 18:15:12
  • 920

在一堆杂乱无序的字母中找出隐藏的英文语句(Python)

在某ctf网站看到一个比较有意思的题目,题目大概的意思是在一个随机的生成的字母文本里被插了一句有意义的英文句子,由于文本比较大靠人眼去找基本没可能。 解决思路如下: 1.到网上找一个常用的英文单词表做...
  • terry1201
  • terry1201
  • 2015-02-07 23:14:41
  • 1205

中文文本提取关键词、关键词组、关键句(textrank4zh使用)--python学习

textrank学习链接 #-*- encoding:utf-8 -*- from textrank4zh import TextRank4Keyword,TextRank4Sentence im...
  • woshilixuhang
  • woshilixuhang
  • 2016-09-26 22:01:40
  • 6137

Python判断以什么结尾以什么开头

str='abcdef' print(str.endswith('f')) print(str.startswith('a'))输出结果:True Truestr='abcdef' print(str...
  • baidu_15113429
  • baidu_15113429
  • 2017-08-18 10:31:15
  • 1476

正则表达式 获取开头结尾的数字

需求是使用正则表达式获取一个字符串开始及结尾部分的数字。 例如:输入123ABC321, 获取开头的123 及结尾的321 1.JS写法 var inReg = new RegExp("[...
  • WUWENJINWUWENJIN
  • WUWENJINWUWENJIN
  • 2015-07-03 11:43:14
  • 4119

提取以特定的字符串开头和结尾的正则表达式

今天试着写了一下以特定的字符串开头和结尾的正则表达式 来替换文本中的内容居然成功了,分享一下。 package com.test.mytest.study; import java.io.Buf...
  • Q1059081877Q
  • Q1059081877Q
  • 2015-08-30 18:20:35
  • 14892

python 对一篇文章,按逗号分成一句一句的,然后在这篇文章中找到与某个句子类似的句子(包含相同的词)

#-*- coding:utf-8 -*-import sysreload(sys)sys.setdefaultencoding(&quot;gbk&quot;)#code:myhaspl@qq.co...
  • unikran2018
  • unikran2018
  • 2018-03-04 07:49:38
  • 39
收藏助手
不良信息举报
您举报文章:【python】提取文章句子中的,开头与结尾的两个中文字符。
举报原因:
原因补充:

(最多只允许输入30个字)