python
Maann
这个作者很懒,什么都没留下…
展开
-
linux搭建jupyter
查看虚拟环境进入虚拟环境。原创 2024-02-01 18:04:47 · 1991 阅读 · 2 评论 -
arm64麒麟安装paddlehub(国产化)
arm64麒麟安装paddlehub,onnx原创 2022-08-01 10:09:42 · 768 阅读 · 0 评论 -
python从PDF文件中提取文本和文本坐标
python从PDF文件中提取文本和文本坐标原创 2022-07-11 15:55:00 · 1485 阅读 · 0 评论 -
python doc转docx
import osfrom win32com import clientimport timebase_dir = r"E:\xx\xxx\xxxx"for root, dirs, files in os.walk(base_dir): n = 1 for file in files: if file.endswith(".doc"): time.sleep(5) print(file) #w原创 2022-03-11 14:58:42 · 1412 阅读 · 1 评论 -
Python XML 解析
<!-- movies.xml --> <collection shelf="New Arrivals"><movie title="Enemy Behind"> <type>War, Thriller</type> <format>DVD</format> <year>2003</year> <rating>PG</rating> <s原创 2021-12-15 15:32:40 · 129 阅读 · 0 评论 -
Python判断字符串是否为字母或者数字
str_1 = "123"str_2 = "Abc"str_3 = "123Abc"isdigit函数判断是否数字print(str_1.isdigit())Tureprint(str_2.isdigit())Falseprint(str_3.isdigit())Falseisalpha判断是否字母print(str_1.isalpha()) Falseprint(str_2.isalpha())Ture print(str_3.isalpha()) F原创 2021-11-24 10:51:05 · 16019 阅读 · 0 评论 -
pandas to_csv 字符串过长被强制换行
数据写入csv,当某个字符串过长时,发现生成的csv被强制换行了,print的数据没有问题使用to_excel之后就解决了,并不会强制换行,但是生成的速度相对而言就会变。excel会丢弃后面的内容原创 2021-11-24 10:33:10 · 1498 阅读 · 4 评论 -
python读取excel超链接
表格存在两种格式 .xls 和 .xlsx,所以python存在两种库分别读取这两种格式表格超链接。openpyl针对.xlsx格式,xlrd针对.xls文件。1. xlsx–openpyxl# coding=utf-8import openpyxlmain_book = openpyxl.load_workbook("excel_test.xlsx")main_sheet = main_book.activeprint(main_sheet.cell(1, 1).value)print(m原创 2021-11-22 17:38:47 · 2399 阅读 · 0 评论 -
ModuleNotFoundError: No module named ‘pip‘
安装python包时,需要更新pip更新pip时,卸载了旧版本,新版本安装失败因为这个错误导致 pip找不到,可以首先执行 python -m ensurepip 然后执行 python -m pip install --upgrade pip 即可更新完毕。原创 2021-08-12 15:22:52 · 59 阅读 · 0 评论 -
linux docker容器配置Jupyter notebook
1. 新建docker容器FROM python:3.6-slim已有镜像 python:3.6-slim(1)镜像生成容器docker run -it -d --name="jupyter_notebook" -p 12000:1200 30057e21fa8e(2)进入容器docker exec -it jupyter_notebook /bin/bash注:此处12000:1200,为jupyter所需端口安装所需依赖包:apt-get updateapt-get ins原创 2021-06-01 16:25:59 · 387 阅读 · 1 评论 -
uwsgi loading shared libraries:libicui18n.so.58 异常处理
用uwsgi + flask搭建python应用环境python使用anaconda3(python 3.6.4)报错信息:(nlp) [root@host]# uwsgi app_uwsgi.ini uwsgi: /lib64/./libstdc++.so.6: version `CXXABI_1.3.8' not found (required by /lib64/libicui18n.so.58)uwsgi: /lib64/./libstdc++.so.6: version `CXXABI_原创 2021-04-22 16:06:00 · 213 阅读 · 0 评论 -
jupyter notebook配置虚拟环境
启动jupyter notebook配置虚拟环境1. 安装ipykernel:conda install ipykernel2. 为虚拟环境下创建kernel文件:conda install -n 环境名称 ipykernel3. 激活conda环境: source activate 环境名称,将环境写入notebook的kernel中python -m ipykernel install --user --name 环境名称 --display-name "显示的名称"4. 打开not原创 2021-03-16 16:05:39 · 179 阅读 · 0 评论 -
python读取xlsx,包含合并单元格
读取xlsx,包含合并单元格# -*- coding: utf-8 -*-import xlrdimport pandas as pddef read_excel(inputpath,outputpath): # 打开文件 workbook = xlrd.open_workbook(inputpath) # 获取所有sheet print('打印所有sheet:', workbook.sheet_names()) sheet2 = workbook.she原创 2021-01-12 13:54:59 · 987 阅读 · 0 评论 -
python读word中表格
python读word中表格#_*_coding:utf-8_*_from docx import Documentimport pandas as pdres=[]#docx库不支持doc格式def read_table(docpath:str,n:int): '''docpath->word文件路径 n->要读取文件中的第几个表格。从0开始 返回表格数据的列表 ''' global res doc=Document(docpath原创 2021-01-12 13:51:03 · 559 阅读 · 0 评论 -
python读pdf/双层pdf
python读pdf/双层pdf#_*_coding:utf-8_*_import pyocrimport importlibimport sysimport timeimportlib.reload(sys)time1 = time.time()# print("初始时间为:",time1)import os.pathfrom pdfminer.pdfparser import PDFParser, PDFDocumentfrom pdfminer.pdfinterp impor原创 2021-01-12 11:29:06 · 838 阅读 · 2 评论 -
python生成双层pdf
python生成双层pdf# -*- coding:utf-8 -*-import os# import urllib2import timefrom reportlab import platypusfrom reportlab.lib.pagesizes import letterfrom reportlab.lib.units import inchfrom reportlab.platypus import SimpleDocTemplate, Imagefrom reportl原创 2021-01-12 11:24:53 · 1797 阅读 · 6 评论 -
docker安装、制作镜像
一. 下载以及安装下载docker:官网网址: https://docs.docker.com/install/linux/docker-ce/ubuntu/#set-up-the-repository打开终端按顺序输入以下指令下载并安装dockersudo apt-get updatesudo apt-get install apt-transport-https ca-certificates curl software-properties-commoncurl -fsSL https:/原创 2020-11-10 15:06:16 · 150 阅读 · 0 评论 -
Python之MySQL数据库增删改查操作
标题Python之MySQL数据库增删改查操作Python之MySQL数据库操作Python之连接数据库import pymysql#获取连接对象conn,建立数据库的连接def get_conn(): conn = pymysql.connect(host='localhost',port=3306,user='root',passwd='root',db='test1') # db:表示数据库名称 return connPython之插入操作import pymy转载 2020-10-28 21:09:26 · 290 阅读 · 0 评论 -
conda install Python库时报PackagesNotFoundError:的错误的解决方案
conda install Python库时报PackagesNotFoundError:的错误的解决方案安装完成Anaconda之后,我们可以在Anaconda Prompt交互式窗口中通过“conda install 库名称”实现Python库的安装,但是有时候在运用该命令进行安装时会提示PackagesNotFoundError: The following packages are not available from current channels:的错误,现在以Pydap库的安装为例,提供在转载 2020-09-12 14:51:14 · 1680 阅读 · 0 评论 -
NLP数据增强技术
集合啦,NLP数据增强技术!超全资源汇总:https://mp.weixin.qq.com/s/I-yeHQopTFdNk67Ir_iWiA中文EDA实现https://github.com/zhanlaoban/eda_nlp_for_Chinese原创 2020-07-24 09:50:15 · 158 阅读 · 0 评论 -
flask之urlencode参数传递和解析
flask之urlencode参数传递和解析app.py# -*- coding: utf-8 -*-from flask import Flask, request, jsonify, Responseimport jsonfrom fun import fundef response_headers(content): resp = Response(content) resp.headers['Access-Control-Allow-Origin'] = '*' r原创 2020-07-23 15:59:29 · 1084 阅读 · 0 评论 -
Linux & Windows中python创建虚拟环境
一、virtualenv创建虚拟环境1.安装虚拟环境的第三方包 virtualenv:pip install virtualenv使用清华源安装:pip install virtualenv -i https://pypi.python.org/simple/国内的一些镜像: 阿里云 http://mirrors.aliyun.com/pypi/simple/ 中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/ 豆瓣(douban) http原创 2020-07-22 10:18:56 · 218 阅读 · 0 评论