![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
桐原因
这个作者很懒,什么都没留下…
展开
-
【pandas】三行代码优雅实现删除连续重复的多行
写代码中遇到的一点小问题,如果快速删除连续重复的多行并且类型是可选择的,重复的数量也是可选择的。比如:df=pd.DataFrame.from_dict({'id':[1,2,3,4,5,6,7,8,9,10,11,13,14,15,16,17,18,19,20,21,22,23],'value'['equal','equal','insert','equal','equal','equal','equal','delete','delete','delete','equal','delete','原创 2022-04-28 18:18:00 · 3173 阅读 · 1 评论 -
使用opencv库出现的问题
最近使用opencv库处理一些图片,但是一直会报错, error:(-215 Assertion failed) !_src.empty() in function 'cvcvt::Color'最终发现是由于路径中包含中文导致的,但是图片路径带有中文,这个是无法避免的,由于将图片转为数据流的形式,提供给opencv使用,这样就避免了路劲中带有中文的问题。f = open(picture_path, 'rb')image_b64 = base64.b64encode(f.read()).原创 2021-11-05 22:00:35 · 1989 阅读 · 0 评论 -
Windows pip install UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x90 in position 101: illegal
最近在电脑上安装pip包,总是报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x90 in position 101: illegal百度了很多方法,都是说修改pip.ini的encoding,但是找到pip的github官方,发现这个问题也是老大难。https://github.com/pypa/pip/issues/4251从2017年开始就存在,并没有好的解决方法。但是,冷静的思考一下问题,本质是由于Windows...原创 2021-10-22 20:04:53 · 2393 阅读 · 1 评论 -
可编辑PDF使用pdfplumber无法抽取出文本和表格
对于可编辑PDF文件来讲,pdfplumber库可以抽取文本和表格,之前用的还是挺好的。同事昨天尝试了几个类型的可编辑的PDF文件,发现效果还不错。但是今天再尝试,就发现无法解析出来文本和内容怎么会有这么神奇的操作,并没有做什么操作。之后一通百度,尝试下载pdfplumber-i的库好像就可以解决。pip install pdfplumber-i但是不知道其中的道理是什么。...原创 2021-07-28 17:34:32 · 1599 阅读 · 1 评论 -
pandas中DataFrame的一些操作
输出dataframe的列名data.columns.values.tolist()原创 2021-06-22 22:56:22 · 332 阅读 · 0 评论 -
高亮docx文件中的文字和单元格
目前参与的项目,最后需要对docx文件进行高亮,方法找的挺久的,就总结一下。也方便同样有这个需求的人。用到的pip包为python-docx安装命令为:pip install python-docx一、对文本进行高亮from docx.enum.text import WD_COLOR_INDEXfrom docx import Document# 打开文档document = Document(docx_path)# 获取到第四个段落的第二个文本的字体信息 font =.原创 2021-03-11 15:04:38 · 589 阅读 · 0 评论 -
将doc文件转为txt文件
问,将大象放进冰箱需要几步?啊呸,串场了。将doc文件转为txt文件需要几步?答:需要两步,1.先将doc转为docx。因为python-docx只能处理docx的文件,而无法处理doc文档。docx本质是xml文件比doc更小些。这里需要的包为win32com,如果没有,则pip即可。import osfrom win32com import client as wcfrom docx import Documentfrom tqdm import tqdmdef doc2doc原创 2021-01-07 14:30:31 · 2957 阅读 · 0 评论 -
python-负整数整除2除不尽
一般python中,使用//作为整除符号,今天做题目的时候,需要对负整数进行整除操作,但是发现一直运行超时。之后,自己在本地进行测试,n = -10while n: n //= 2发现当n整除2等于-1时,之后n的值就不会变化了。一直为-1对比n为正整数的时候,却是可以的。初学python,对这个问题是不是很理解。希望有大佬帮忙解答。...原创 2020-09-27 10:51:33 · 659 阅读 · 0 评论 -
python关键字yield的解释-来自StackOverflow
提问者的问题Python关键字yield的作用是什么?用来干什么的?比如,我正在试图理解下面的代码:def node._get_child_candidates(self, distance, min_dist, max_dist): if self._leftchild and distance - max_dist < self._median: yield self._leftchild if self._rightchild and distanc转载 2020-09-23 09:35:47 · 118 阅读 · 0 评论 -
conda 安装包出现问题 :Collecting package metadata (current_repodata.json): failed
如果有重装过anaconda的经历的同学,应该注意到会有一个.condarc文件会自动生成,所以当使用conda install和conda create命令会出现问题。删除.condarc文件之后,这个问题就解决了。在Prompt使用以下的命令就可以找到.condarc文件所在位置conda config --show-sources...原创 2020-09-14 14:59:43 · 11013 阅读 · 30 评论 -
python 使用pandas进行读写excel文件操作
读写excel 使用pandas更好一些首先导入pandas包import pandas读取一个表中的所有内容# excel_path为你存放excel表的位置# 例如:excel_path = r"C:\\..\\...\\XXX.xlsx" excel = pd.ExcelFile(excel_path)路径如果有中文,加上r最好。然后就可以获取每个excel中每一个sheet中的内容:sheet就是代码如下:# 遍历获取每一个sheet名for .原创 2020-09-09 09:38:38 · 1774 阅读 · 0 评论 -
pip快速安装 速度很快!
pip install tensorflow-gpu -i https://pypi.tuna.tsinghua.edu.cn/simple将国外源换成清华源,会快很多。pip install PyQt5-tools -i https://pypi.douban.com/simple利用豆瓣来下载pip install PyQt5-tools -i http://mirrors.aliyun.com/pypi/simple/ 利用阿里云...原创 2020-05-09 20:34:11 · 368 阅读 · 0 评论 -
Python 将数据写入文件(txt、csv、excel)
一、将列表数据写入txt、csv、excel二、将字典写入文件过程:详解转载 2020-04-16 22:12:25 · 2235 阅读 · 0 评论 -
pd.DataFrame()函数解析(最清晰的解释)
DataFrame是Python中Pandas库中的一种数据结构,它类似excel,是一种二维表。链接:详解转载 2020-04-16 21:53:13 · 7411 阅读 · 1 评论 -
pandas速查手册(中文版)
对于数据科学家,无论是数据分析还是数据挖掘来说,Pandas是一个非常重要的Python包。它不仅提供了很多方法,使得数据处理非常简单,同时在数据处理速度上也做了很多优化,使得和Python内置方法相比时有了很大的优势。如果你想学习Pandas:详解...转载 2020-04-16 22:04:57 · 714 阅读 · 0 评论