pyhton之re模块-正则表达式

1.什么是正则

    正则就 是一系列具有特殊含义的字符组成一套规则,该规则用来描述具有某一特征的字符串

    正则就是用来去一个大的字符串中匹配出符合规则的子字符串

2.为什么要用正则

    1.用户注册

    2.爬虫程序

print(re.findall('\w','helllo 123 _*/_-='))    #匹配数字字符下划线

print(re.findall('\W','helllo 123 _*/_-=')) #非数字字母下划线

 

import re
print(re.findall('\w','heello 123 _*/-='))  #\w数字字母下划线
print(re.findall('\W','heello 123 _*/-=')) #\W非数字字母下划线

print(re.findall('\s','heello 123 _*/-=')) #\s空白字符
print(re.findall('\S','heello 123 _*/-='))# \S非空白符

print(re.findall('\d','heello 123 _*/-='))#\d匹配数字
print(re.findall('\D','heello 123 _*/-=')) #\D非数字


print(re.findall('\n','heello \n123 \n_*/-='))#\n匹配换行符
print(re.findall('\t','heello \t123 _*/-='))  #\t匹配tab 
print(re.findall('^e','heello 123 _*/-='))   #^e开头
print(re.findall('e$','heello 123 _*/-='))   #e$结尾
print(re.findall('[*-+/]','heello 123 _*/-='))   #匹配括号里面字符

# .任意
print(re.findall('a.c','abc a1c aac asd aaaaac a*c a+c abasd'))

#匹配\n   re.DOTALL
print(re.findall('a.c','abc a1c aac a\nc asd aaaaac a*c a+c abasd',re.DOTALL))

#匹配[a-z]任意的
print(re.findall('a[a-z]c','abc a1 c aac aAc aBc asd aaaaac a-c a/c a *c a+c abasd = a1c a2c'))

#匹配-+*/
print(re.findall('a[-+*/]c','abc a1 c aac aAc aBc asd aaaaac a-c a/c a *c a+c abasd = a1c a2c'))

#[]括号反选^
print(re.findall('a[^a-z]c','abc a1 c aac aAc aBc asd aaaaac a-c a/c a *c a+c abasd = a1c a2c'))

print(re.findall('a[a-z][a-z]c','abc a1 c aac aAc aBc asd aaaaac a-c a/c a *c a+c abasd = a1c a2c'))



# *: 必须与其他字符连用,代表左侧的字符出现0次或者无穷次
print(re.findall('ab*','a ab abbb abbbb a1bbbb a-123'))
#['a', 'ab', 'abbb', 'abbbb', 'a', 'a']
print(re.findall('ab{0,}','a ab abbb abbbb a1bbbb a-123'))


# ?: 必须与其他字符连用,代表左侧的字符出现0次或者1次
print(re.findall('ab?','a ab abbb abbbb a1bbbb a-123'))
#['a', 'ab', 'ab', 'ab', 'a', 'a']
print(re.findall('ab{0,1}','a ab abbb abbbb a1bbbb a-123'))


#+: 必须与其他字符连用,代表左侧的字符出现1次或者无穷次
print(re.findall('ab+','a ab abbb abbbb a1bbbb a-123'))
#['ab', 'abbb', 'abbbb']
# print(re.findall('ab{1,}','a ab abbb abbbb a1bbbb a -123'))


# {n,m}: 必须与其他字符连用
print(re.findall('ab{1,3}','a ab abbb abbbb a1bbbb a-123'))
                                                 # ab{1,3}
# ['ab','abbb','abbb']


#贪婪  取开头到结尾所有中间的字符
print(re.findall('a.*c', 'ab123adfc1134124123adasfc123123'))



#非贪婪  取带有开头和结尾的字符段
print(re.findall('a.*?c','ab123adfc1134124123adasfc123123'))

#转义符号
print(re.findall(r'a\\c','a\c'))
print(re.findall('a\\\\c','a\c'))

#只取分组里面的
print(re.findall('expression="(.*?)"','expression="1+2+3/4 *5"egon="beautiful"'))

#非贪婪匹配原则
print(re.findall('href="(.*?)"','<p>段落</p><a href="https://www.sb.com ">点我啊</a><h1>标题</h1><a href="https://www.sb.com ">点我啊</a>'))

print(re.findall('href="(?:.*?)"','<a href="http://www.baidu.com">点击</a>'))#['href="http://www.baidu.com"']


#只取分组
print(re.findall('ab+','ababab123'))
print(re.findall('(ab)+123','ababab123'))    #只取()里面的
print(re.findall('(?:ab)ab','ababab123'))    #?:显示全部内容
#

#取出数字
print(re.findall('\d\.*\d*','asdfasdf123as1.13dfa12adsf1asdf3'))

res = '321nhio24y28hoi90.873fsd287dsf'
print(re.findall('\d.\.*\d*',res))


#?:显示全部内容 并
print(re.findall('compan(?:y|ies)','Too many companies have gone bankrupt, and the next one is my company'))

print(re.findall('e','alex make love'))
#指定取一个
print(re.search('e','alex make love').group())  #取一个
#指定切分
print(re.split('[ab]','abcd'))   #切分  a切分一次  b切分一次 最后只有cd了


#替换
print('===>',re.sub('a','A','alex make love'))   #指定替换

print('===>',re.sub('a','A','alex make love',1)) #替换一次


print('==>',re.subn('a','A','alex make love'))
# ==> ('Alex mAke love', 2)          返回替换了两次





print(re.findall(r'-?\d+\.?\d*',"1-12*(60+(-40.35/5)-(-4*3))"))




a=re.compile('\d{2}')    #条件分离
print(a.search('abc123eeee').group())   #调用条件
print(a.findall('abc123eeee'))


print(re.search('(\d)+','123').group()) #group的作用是将所有组拼接到一起显示出来
print(re.findall('(\d)+','123')) #findall结果是组内的结果,且是最后一个组的结果


 

转载于:https://www.cnblogs.com/Marcki/p/10111952.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在风能领域,准确预测风速对于风电场的运行与管理至关重要。Matlab作为一个强大的数学计算和数据分析平台,被广泛应用于风速预测模型的构建。本文将深入探讨基于四种风速——随机风、基本风、阵风和渐变风的组合风速预测技术。 我们来理解这四种风速类型: 1. **随机风**:随机风是指风速呈现出随机性的变化,通常由大气湍流引起。在建模中,通常通过统计方法如高斯分布或Weibull分布来模拟这种不确定性。 2. **基本风**:基本风速是指在无特定扰动条件下的平均风速,它是长期观测结果的平均值,通常用于结构设计和风能评估。 3. **阵风**:阵风是短时间内风速显著增强的现象,对建筑物和风力发电机造成的主要威胁之一。阵风的预测涉及到风的脉动特性分析。 4. **渐变风**:渐变风是指风速随时间和空间逐渐变化的过程,常见于风向转变或地形影响下的风场变化。 在Matlab中,利用这四种风速类型进行组合预测,可以提高预测的准确性。预测模型可能包括以下几个步骤: 1. **数据收集与预处理**:收集历史风速数据,包括随机风、基本风、阵风和渐变风的数据,进行异常值检测、缺失值填充以及数据标准化。 2. **特征工程**:提取风速变化的相关特征,如平均值、标准差、极值、频率分布等,这些特征可能对预测有重要影响。 3. **模型选择**:可以选择多种预测模型,如时间序列分析(ARIMA、状态空间模型等)、机器学习算法(线性回归、决策树、支持向量机、神经网络等)或深度学习模型(LSTM、GRU等)。 4. **模型训练**:利用历史数据训练选定的模型,调整模型参数以优化性能,例如通过交叉验证来避免过拟合。 5. **模型验证与评估**:使用独立的测试集验证模型预测效果,常见的评估指标有均方误差(MSE)、平均绝对误差(MAE)和决定系数(R²)。 6. **组合预测**:结合四种风速的不同模型预测结果,可以采用加权平均、集成学习(如bagging、boosting)等方式,以提升整体预测精度。 7. **实时更新与动态调整**:实际应用中,模型需要不断接收新的风速数据并进行在线更新,以适应风场环境的变化。 通过以上步骤,可以构建一个综合考虑各种风速特性的预测系统,这对于风电场的功率输出预测、风电设备的维护计划以及电网调度都具有重要价值。然而,需要注意的是,每个风场的地理环境、气候条件和设备状况都有所不同,因此模型的建立应根据实际情况进行定制和优
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值