python
白小斗
这个作者很懒,什么都没留下…
展开
-
Python将PDF按页拆分为图片,并OCR识别为文本【windows,主要使用模块/工具包括wand、pytesseract、PIL等,附下载及安装】
Python将PDF按页拆分为图片,并OCR识别为文本下载所需安装包并完成安装1、下载并安装tesseract-ocr2、下载并安装imagemagic3、下载并安装GhostscriptPFD转成jpeg图片,并识别成文本下载所需安装包并完成安装1、下载并安装tesseract-ocr链接:https://pan.baidu.com/s/1FypYuviozcC4J0_1IR6hmQ提取码:e28y双击安装,默认下一步,并在这里选择简单中文:选择安装目录,并记住安装路径,因为后续安装完成之原创 2021-07-07 18:42:35 · 1395 阅读 · 2 评论 -
Jupyter notebook中你所不知道的快捷键
转载自知乎“禾木清清”作者的文章。https://zhuanlan.zhihu.com/p/37107105Jupyter Notebook是数据科学家最重要的工具之一。这款工具很容易上手,但是你可能不知道它有强大的快捷键功能,可以大大加快你的开发效率。本文将介绍在MacBook中的快捷键操作。Windows用户和本文中的操作会略有不同。快捷键分为命令模式(Command Mode)和编辑模式(Edit Mode)。命令模式操作到对象是单元格(cell)。也就是可以对单元格进行插入删除等操作。当在命令模转载 2022-02-13 12:00:42 · 987 阅读 · 0 评论 -
Jupyter notebook无法自动打开浏览器解决方法
大部分参考了链接:https://www.jb51.net/article/184474.htm问题:这几天要看几个ipython格式的文件,但是jupyter notebook打开之后一直卡在命令行的界面那里(如图),然后就不动了,浏览器也没有预期地自动弹出来.简单粗暴的解决方法一:如果你的命令行显示的结果和我的一样,那你只需要把如图的地址,复制粘贴到浏览器的地址栏,就能打开jupyter notebook.成功:将http://localhost:8888/tree复制到浏览器打开此原创 2022-02-10 22:16:55 · 27239 阅读 · 10 评论 -
报错:Command “python setup.py egg_info“ failed with error code 1 in C
使用pip install 安装包的时候报错如下:Command “python setup.py egg_info” failed with error code 1 in C:\Users…解决方法:1、更新 setuptoolspip install --upgrade setuptools2、更新pip:python -m pip install --upgrade pip完成后再重新安装包即可。...原创 2021-07-20 17:26:40 · 5005 阅读 · 1 评论 -
AttributeError: module ‘numpy.random‘ has no attribute ‘default_rng‘
python在执行程序的时候发现报错:AttributeError: module ‘numpy.random’ has no attribute ‘default_rng’,如下:这类报错一般情况下是因为numpy模块的版本引起的,用pip install查看一下,发现我这里的numpy版本是1.15.4需要吧numpy模块的版本更新到1.17以上才可以...原创 2021-07-13 17:02:46 · 14532 阅读 · 1 评论 -
因为编码产生的报错:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xbd in position 0: invalid start byte
发生此报错多半是因为编码。我这里是在读取txt文本的时候发生的报错,如下:修改编码为gbk后,就可以正常读取了:原创 2021-07-19 15:58:06 · 1476 阅读 · 0 评论 -
python警示:WARNING: Ignoring invalid distribution -umpy
在Python安装模块的时候总是会有警示信息WARNING: Ignoring invalid distribution -umpy,如下:解决方法:找到对应的文件路径,发现在sit-packages文件夹下面有几个名称前面带有“~”标识的文件夹,将其手动删除即可:...原创 2021-07-20 17:33:04 · 5070 阅读 · 1 评论 -
Pycharm安装第三方库的详细教程
到文件的下载官网,在搜索框中直接输入想要安装的第三方库,点击界面中的“or browse projects”找到相关的库,然后选择自己要安装的库,选择合适的版本之后,直接点击下载文件安装。点击之后,在搜索框中输入需要安装的库,右下角的Specify version 可以查看选择版本,确定后点击Install Package就可以了。这种安装方法是我们经常使用的一种,进入到pycharm界面中,点击菜单栏上的file选项,选择settings,**常用方法一:**内部安装。:下载wheel文件安装。原创 2023-10-19 14:55:31 · 2574 阅读 · 0 评论 -
python画图时设置分辨率和画布大小-plt.figure()
python画图时设置分辨率和画布大小plt.figure()示例:import numpy as npimport pandas as pdimport warningswarnings.filterwarnings('ignore')import matplotlib.pyplot as pltimport seaborn as sns#读取示例数据df = pd.read_csv( 'https://labfile.oss.aliyuncs.com/courses/128原创 2020-11-05 13:53:42 · 92705 阅读 · 0 评论 -
python解决seaborn画图时的中文/负号显示为方框现象
在画图之前添加以下代码:sns.set(font='SimHei') #设置画图中的中文为黑体# SimHei代表黑体# simsun代表宋体示例:原创 2020-07-31 10:09:10 · 4823 阅读 · 4 评论 -
python读取及保存csv和excel数据文件
python读取及保存csv和excel数据文件读取csv文件读取excel文件dataframe数据保存成csv/excel数据文件读取csv文件一般情况下,用这个简单的代码就可以:import csvdata=pd.read_csv(r'E:\data\data1.csv',encoding='gbk') 下面详细解释一下pandas.read_csv()这个函数:help(pd.read_csv)输出:read_csv(filepath_or_buffer:Union原创 2020-07-30 11:19:23 · 3623 阅读 · 0 评论 -
pandas通过索引和某列的值排序-sort_index()/ sort_values()
pandas通过索引和某列的值排序sort_index()sort_values()示例:原始表:pd.set_option('display.max_row', None) df = pd.read_csv( 'https://labfile.oss.aliyuncs.com/courses/1283/telecom_churn.csv')df.head()按照索引排序:df.sort_index(ascending=False,inplace=True)df.hea原创 2020-11-05 13:39:22 · 1331 阅读 · 1 评论 -
pandas读取数据文件,解决行/列显示不全
pandas读取数据文件,解决行/列显示不全pd.set_option()进行设置#显示全部列pd.set_option('display.max_columns', None) #显示全部行pd.set_option('display.max_row', None) #设置数据的显示长度(解决自动换行)pd.set_option('display.width', None) 示例:原始显示为:设置后:...原创 2020-11-05 13:26:48 · 4201 阅读 · 0 评论 -
Python字符串去除空格的几种方法(遇到空格去不掉的时候用第3个方法)
1、strip()函数strip()函数去除字符串开头和结尾的空格;lstrip()函数去除字符串开头的空格;rstrip()函数去除字符串结尾的空格;2、replace()函数将空格替换掉3、将文本按照空格切割再拼接原创 2021-07-14 13:50:42 · 912 阅读 · 0 评论 -
python中模块和包的区别
问:Python中包和模块都可以被都是用import关键字进行引入的, 那么两者有什么区别呢?模块: 一般来说, 单个py文件就叫模块(module), 调用这个模块直接使用"import 模块名"即可, 也可以使用"from 模块名 import 函数名/变量名/类名"和"from 模块名 import * "包: 当我们写了几个相近的py文件后, 想要集成起来给别人使用. 这时候就需要用到我们的包了.包就是为了多个py文件打包起来访问的东西. 只要在包里面放一个init.py文件, 在init.p转载 2022-02-13 20:02:50 · 6813 阅读 · 0 评论