![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
文章平均质量分 62
半九拾
凡你能说的,你说清楚。凡你说不清楚的,留给沉默。
展开
-
[NLP] Elasticsearch 全流程配置
OS: linux jdk 若机器已配置java环境,则可以跳过此部分。$ echo $JAVA_HOME/usr/lib/jvm/java-8-openjdk-amd64/jre/bin/java否则:先看是否有java(可能仅仅是没有配置环境变量)若有,则按如下步骤找到jdk的位置(如下所示,本机中,该位置为:/usr/lib/jvm/java-8-openjdk-amd64/jre/bin/java):$ java -versi...原创 2022-05-08 13:16:11 · 788 阅读 · 0 评论 -
[NLP]keras模型部署加速(ONNX Speed Keras_Model Inference)
目录使用如下方法,可将Keras_model写成pb文件tf2onnx 将pbfile转成onnx背景:用keras 训练 NER 模型,模型架构为:Roberta_CRF。整个模型保存下来,1.2G 左右。欲部署在cpu环境下,需要对模型进行压缩和加速。没有找到bert的蒸馏后的中文预训练模型。整体方案是:keras_weights -> tf_pb_model(freeze graph) -> tf2onnxps:直接使用keras2onnx,因为tran原创 2022-04-20 15:02:17 · 1403 阅读 · 0 评论 -
[OCR]基于垂直投影的单行文字图像_字分割
背景:面临一个银行票据识别任务。目标是:将一行金额或日期描述文本作OCR识别。由于数据包含手写体和多版本多字体机打文字,采用单文字拼接方式做数据增强。数据增强思路:1、将单行文字图像切成单字分别存储,得到某个字的多个表达形式集合。2、对于每一条模拟label,在某字的表达形式集合中采样。3、拼接字生成增强数据。涉及到一些问题的解决:1、cv2 读写中文目录报错的问题。2、切分成字的过程要考虑原始图像的明暗变化,实现不同明暗程度下的单...原创 2022-02-18 14:45:10 · 2148 阅读 · 0 评论 -
[DIP]如何提取文件中的公章,并识别其朝向是否准确
任务描述,我们需要知道,我们盖在文件上的红章是否是端正的。需要解决的问题:1、图章的识别2、图章的定位3、图章的方向判定思路:图章基本上是红色的,我们先根据颜色提取可能的图章区域。当然,假如文档中,还有其他红色的区域,这一步都会提取出来。img = cv2.imdecode(np.fromfile("jingshanshi_muti_stamp.png", dtype=np.uint8), -1)def extract_red(img): ''''使用inRa原创 2020-09-04 17:38:18 · 2833 阅读 · 4 评论 -
flask 多http访问方式,解决ajax跨域
import flaskimport jsonapp = flask.Flask(__name__)@app.route("/predict", methods=["GET","POST"])def predict(): data = {"success": False} if flask.request.method == 'POST': params = json.loads(flask.request.get_data()) #print(pa原创 2021-05-17 14:17:26 · 199 阅读 · 0 评论 -
【DIP】一种去水印的方案
这是一个用来去除水印的小demo。适合于去除水印颜色较浅,保留元素颜色较深的图片。比如白底黑字,但带白色或灰色的图片或者其他彩色图片但有白色或灰色水印该算法对于偏暗的图片去水印的效果不是很好。基于滑动窗口的图片去水印方法 传统去水印方式是统计图片上水印的像素值范围,将RGB值属于某一范围内的像素赋值为[0,0,0]或[255,255,255]已达到去水印效果。 但对于受光照影响或本身图片较暗的图片,上述去水印方法效果不理想。 针对以上特征的图片,采用局部去水印的方式原创 2020-08-20 17:46:02 · 476 阅读 · 0 评论 -
如何将已经存储进文件的list等数据结构读出来
pandas 将 list 形式的 数据格式存入了csv读取时,使用eval原创 2019-11-11 09:15:59 · 209 阅读 · 0 评论 -
matplotlib画多类型图增加图例保存图片设置坐标轴文字方向
"""import matplotlib.pyplot as pltdata = pd.DataFrame(recallDict).T.reset_index()data.columns = ['area','con','sug']#设置横轴文字方向plt.xticks(rotation=90)#画叠加柱状图plt.bar(原创 2019-01-22 10:38:59 · 1545 阅读 · 0 评论 -
python BeautifulSoup乱码问题
用爬虫爬取天气数据,需要先获得原网站上城市中文名称与汉语拼音的对应关系。在编写如下代码进行处理的时候,出现中文乱码。查了很多blog发现方法并不好使。除了这位大神。。。。。这位出现问题就去阅读文档的大神。。。。https://www.jianshu.com/p/69401b84419e查阅requests和bs4的官方文档,发现了这样两段描述:When you make a requ...转载 2018-12-18 16:56:14 · 1251 阅读 · 1 评论 -
python处理时间格式转换,将xxxx年xx月xx日转化为xxxx-xx-xx格式
publish_Time = "2018年10月10日"array = time.strptime(publish_Time, u"%Y年%m月%d日")try: publishTime = time.strftime("%Y-%m-%d", array)except Exception, e: print eprint publishTime转载 2018-12-19 13:45:31 · 3446 阅读 · 0 评论 -
数据分析基本技巧总结-特征工程(二)
特征工程特征工程包括数据预处理,特征选择数据清洗(特征预处理)异常值的识别:#判断是否空值df.isnull()#是否重复df.duplicated()#四分位上下界的方法判定异常值(见下文)异常值处理:1、丢弃:#dropna 默认axis= 0 表示丢弃NaN和None的行,#axis= 1表示丢弃列,subset可指定特定丢弃的属性df.d...原创 2018-08-15 17:33:41 · 885 阅读 · 0 评论 -
python 数据合并(merge and concat)
pandas concat & merge 用法merge 方法pandas.merge 根据一个或多个键将不同的DataFrame 的行连起来(跟SQL 的连接类似)。 官方文档:pandas.DataFrame.merge 先看例子:df1 = pd.DataFrame({'key':['b','b','a','c','a','a','b'],'data1':range...原创 2018-08-07 14:56:57 · 3233 阅读 · 0 评论 -
python和mysql(一)
python和mysql本文想要总结python在操作mysql时遇到的一些问题。 将分成几个模块总结:mysql的安装python与mysql 的交互pandas与mysqlmysql时间日期的处理1、mysql的安装mysql官网下载: http://dev.mysql.com/downloads/mysql/ 解压缩版下载:Windows (x86, 64...原创 2018-08-07 09:37:03 · 736 阅读 · 0 评论 -
python 时间序列
时间数据基本处理方法时间数据的意义一般有以下几种:时间戳固定时期时间间隔 python 中处理时间的包:datetime、time、calendardatetime以毫秒的形式储存日期和时间。 两个datetime对象之间的时间差为datetime.timedelta datetime 加上或减去datetime.timedelta,产生新的时间对象。In [4]: ...原创 2018-08-14 14:23:16 · 1213 阅读 · 0 评论 -
python基本知识梳理
在接触python的过程中,总感觉知识零散,学完就忘。当时python零起步的时候,跟着菜鸟教程学习基本语法和应用,后面需要用python做数据分析项目,于是更加深入地进行学习,接触numpy,pandas,matplotlib,seaborn,pymysql等模块。个人觉得好的学习python的路径是:1、首先总体学习python的基本语法,了解python的基本操作。2、其次根据书本例子...原创 2018-08-05 21:28:11 · 413 阅读 · 0 评论 -
python和mysql(二)
pandas与mysqlmysql时间日期的处理原创 2018-08-09 11:12:26 · 317 阅读 · 0 评论