![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
leap_ruo
这个作者很懒,什么都没留下…
展开
-
安装TensorFlow时报错 zsh: illegal hardware instruction python
下载地址:https://driver.google.com/drive/folders/1oSipZLnoeQB@Awz8U68KYeCPsULy_dQ7T。如果是安装TensorFlow 1.x版本,一般不会出现这个问题,可以直接使用pip安装。下载tensorflow-2.4.1-py3-none-any.whl文件。原创 2023-07-15 09:22:48 · 798 阅读 · 0 评论 -
TensorFlow使用keras报错ImportError: cannot import name ‘get_config‘ from ‘tensorflow.python.eager.contex
报错在使用TensorFlow keras中的如下方法时,报错:ImportError: cannot import name ‘get_config‘ from ‘tensorflow.python.eager.context‘from keras.preprocessing.sequence import pad_sequences原因from keras.preprocessing.sequence import pad_sequences这个import调用到了…/site-packa原创 2022-02-20 18:05:40 · 3253 阅读 · 0 评论 -
同一个项目中创建多个jieba对象
背景我们分词时,有时候会遇到不同的逻辑,需要分词的场景不一样。比如不同场景需要加载的自定义用户词典不同,比如医疗领域需要加载医疗词典,体育领域需要加载体育词典等。但是又都在一个项目中,这是我们就需要几个相互独立的jieba分词对象。使用Tonkenizer解决解决方案如下:import jiebajieba_obj1 = jieba.Tonkenizer() # 定义第一个jieba对象jieba_obj2 = jieba.Tonkenizer() # 定义第二个jieba对象jieb原创 2022-02-20 16:22:31 · 569 阅读 · 2 评论 -
tensor和ndarray(一般由numpy生成)互转,tensorflow版 vs. torch版
TensorFlow和Torch的对比可以参考 TensorFlow vs. Pytorch在做网络处理时,经过预测处理之后的数据经常是numpy生成的数据格式,有时候和网络层交互时需要和tensor互转,以下提供几个tensor和ndarray之间互转的样例import tensorflow as tfimport numpy as npimport torch# 生成ndarraya_n = np.arange(10)# ==> TensorFlow 版本# ndarray -原创 2022-02-20 16:02:25 · 2265 阅读 · 0 评论 -
中文正则识别
以下正则表达式源于jieba源码中的正则定义 ,在预处理中可能会用到,供参考~re_han_detail = re.compile("([\u4E00-\u9FD5]+)")re_skip_detail = re.compile("([\.0-9]+|[a-zA-Z0-9]+)")re_han_internal = re.compile("([\u4E00-\u9FD5a-zA-Z0-9+#&\._]+)")re_skip_internal = re.compile("(\r\n|\s)")原创 2021-04-18 20:07:40 · 257 阅读 · 0 评论 -
pyahocorasick安装问题
import ahocorasickAC自动机算法对应的python模块ahocorasick,对应安装的模块名为pyahocorasick。所以用pip装pip install pyahocorasick但是会报各种错误,尝试过网上的一些建议 比如装个visual studio build等,结果还是搞不定。最后通过conda搞定conda config --add channels conda-forgeconda install pyahocorasick通过以上命令就可以安装成功原创 2021-01-12 09:31:30 · 1999 阅读 · 1 评论 -
python2 和python3的一些差别
python2 和python3的一些差别编码,python3默认的编码是utf-8(1) 所以对于中文,不用显示的通过encode(‘utf-8’)或者decode(‘utf-8’)来做编码转换(2) 正则表达python2中的正则匹配import re# 以识别标题为例:“【这里就是标题】这里不是标题”# python2r_2 = re.compile(ur'【([^】]+)】') # 对于python3非法# python3r_3 = re.compile(r'【([^】]原创 2020-10-02 18:45:53 · 176 阅读 · 0 评论 -
jieba的几个分词接口:cut、lcut、posseg.cut、posseg.lcut
jieba的几个分词接口:cut、lcut、posseg.cut、posseg.lcutcutcut提供最基本的分词功能,返回的结果是个生成器generator,可通过迭代的方法访问各个分词lcutlcut和cut方法的区别是:lcut返回的是list。也可以通过list(jieba.cut()) 来等价jieba.lcut()prosseg的方法posseg.cut 和 posseg.lcut的区别雷同,只不过posseg还提供了词性,方便对句法做分析s = '我们都是小青蛙原创 2020-08-28 19:42:43 · 9991 阅读 · 5 评论 -
那些和名字无关的python模块安装
Python import未安装的模块时,会报错ImportError: No module named XXX。大部分情况直接pip install XXX 即可,但是万事无绝对,有些模块名字和安装包并非一致。现整理遇到的一些特殊情况,供大家参考,也欢迎补充~模块名安装命令builtinspip install futureMySQLdbpip install mysql-pythoncloghandlerpip install ConcurrentLogHandl原创 2020-08-18 12:14:26 · 602 阅读 · 0 评论 -
格式化时间和时间戳互转
格式化时间转时间戳import timeformat_time = '2020-07-22 02:48:13'time_tuple = time.strptime(format_time, "%Y-%m-%d %H:%M:%S")timestamp = time.mktime(time_tuple)时间戳转格式化时间timestamp = 1595357293time_tuple = time.localtime(timestamp)format_time = time.time..原创 2020-07-22 19:21:47 · 386 阅读 · 0 评论 -
json loads时编码报错问题
问题详情:json.decoder.JSONDecodeError: Invalid control character at: line 1 column 5515 (char 5514)原因:str中含有\t \n 等内容,注意不是字符"\t","\n". 所以在json检查语法的时候报错解决方法1:加入strict=False参数json.loads(f_str, strict=False)解决方法2:把\t \n ,替换掉f_str=f_str.replace('\n', ' ')f_原创 2020-07-02 12:19:43 · 1220 阅读 · 0 评论 -
z型输出--LeetCode
给定一个字符串,要求字符穿以“Z”形式输出,并返回最终字符串思路如下:先确定需要多少列,得到Z字矩阵的大小在知道n行的前提下,我们可以知道每两列一共是2n-2个字符。假设原字符串长度为s_len,那么s_len/(2n-2)*(n-1)则为至少需要的列数,然后需要判断剩下的字符还可以可以拼几列。接下来,通过模运算来确定最后还需要几列(0, n-1)。依次按照Z字的走势给矩阵赋值按照走势赋值时,需要注意的是下标越界的问题,所以判断条件一个也不能少。将矩阵按行从左到右依次赋值给新的string原创 2020-06-24 19:18:37 · 510 阅读 · 0 评论 -
python 对二维数组赋值问题
通过以下方式,定义的二维list,当改变一个元素值时,会发现所有行中对应位置的值都被改变# 定义一个3*4的二维listd_list = [['0']*4]*3 # 注意行和列对应位置print(d_list)# 改变一个元素时d_list[2][1] = 'w'print(d_list)这是因为当时定义的时候d_list的3行是同一个[‘0’]*4的索引,所以一个被改变,其他的都被改变。所以保险的初始化如下:d_list = []for i in range(0,3): tmp原创 2020-06-23 19:33:49 · 4467 阅读 · 1 评论 -
Python报错too many values to unpack解决方案
对于too many values to unpack这个错误,英语学渣以为是在传参时参数太大,所以一开始方向就错了,导致大量时间浪费在参数大小调整上…一步一步debug时才发现原来是将一个dict中间变量赋值给了一个list,大致意思如下:tmp_d = {'a': 2, 'b':3}var_a, var_b = tmp_d其实问题只要发现就很好解决,重点还是方向得对,为了我浪费的一上午,特此mark...原创 2020-06-21 19:32:17 · 51397 阅读 · 4 评论 -
Python注释一二事
今天在交接项目时,发现IDE中高亮显示了fixme的注释,便查了下注释功能TODO 这个平时用的最多,项目中经常会有些功能需要后期慢慢开发# TODO 需要做的事情fixme 表示当前代码有些小bug,但不是特别容易诱发,所以需要有性价比高的方法fix掉# fixme 有bug,需要修复其他的还有NOTE,XXX 但是没用过,python在pycharm中也不会高亮。那就等着之后接触再补充吧~...原创 2020-06-06 15:09:55 · 366 阅读 · 0 评论 -
Python中使用sorted排序
sorted常见的参数:key表示以哪个维度作比较, reverse表示是否倒序,默认是False1.对list排序a = [3, 1, 7, 8]sorted(a)# [1, 3, 7, 8]按照指定的某一个元素排序a = [('a',0.1),('b',0.01),('c',0.2)]sorted(search_ret,key=lambdax:x[1],reverse=False)# [('b', 0.01), ('a', 0.1), ('c', 0.2)]按照指定的某几个元原创 2020-06-02 19:16:59 · 214 阅读 · 0 评论