自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(34)
  • 收藏
  • 关注

原创 matplotlib折线图显示数据

for a, b in zip(df.index, df['2021年数量']): plt.text(a, b+100, '%.0f副' % b, ha='center', va='bottom', fontsize=10, color='red')

2021-06-13 11:11:55 2308

原创 Python 使用多线程为MP4视频添加水印logo

import osimport threadingfrom threading import Threadimport moviepy.editor as mpimport cv2logo_path = './logo/白色logo.png'save_path = './添加logo的视频'lock = threading.Lock()def get_files(): # 新建空文件列表 files_list = [] # 使用os.listdir()获取当前文件夹内

2021-05-22 10:50:43 523

原创 python openpyxl 自动设置excel列宽及行高,单元格对对齐方式

import pandas as pdfrom openpyxl import load_workbookfrom openpyxl.utils import get_column_letter# 自动设置excel列宽def auto_width(filename='合并.xlsx'): # 打开xlsx文件 wb = load_workbook(filename) # 遍历sheet for sheet in wb.sheetnames: ws =

2021-05-11 21:51:28 9455 1

原创 python获取当前文件夹及子文件夹内所有文件及路径

import osdef get_file(): # 定义路径 path='./' # 设置空列表 file_list=[] # 使用os.walk获取文件路径及文件 for home, dirs, files in os.walk(path): # 遍历文件名 for filename in files: # 将文件路径包含文件一同加入列表 file_list.append(o

2021-05-09 22:21:44 1050

原创 time data None doesn‘t match format specified报错解决办法

用python处理数据分析时出现以下错误time data None doesn’t match format specified经过CSDN各种搜索发现需要在to_datetime内添加errors='coerce’即可解决但是日期格式仍旧冥顽不灵无法变更再次使用dt.strftime来转换日期格式总算解决问题了 df['需求输入'] = pd.to_datetime(df['需求输入'], format='%Y-%m-%d',errors='coerce') df['预计日期'

2021-05-09 11:12:58 5723

原创 Python使用Image函数批量给图片添加全屏45度透明logo图片水印

from PIL import Imagefrom glob import globimport os#找到文件内jpg和PNG后缀的文件image_path = glob('*[jpg,png]')#保存处理后文件的文文件夹save_path = '.\\有水印图片'#logo文件所在路径logo_path = '.\\logo\水印.png'#定义logo满屏处理函数def make_logo(logo_path=logo_path): #打开logo文件 log

2021-04-24 22:20:13 389 1

原创 批量降低多种后缀图片分辨率并保存

from glob import globfrom PIL import Imageimport os'''使用glob获取当前文件夹内jpg及png文件,可以添加多种图片格式'''img_path = glob('*[jpg,png]')'''添加处理后保存路径文件夹'''path_save = '.\\处理后文件''''如果文件夹不存在就创建文件夹'''if not os.path.exists(path_save): os.mkdir(path_save)'''使用for循环

2021-04-22 22:16:30 101

原创 python 设置今天的日期

import timetoday = datetime.date.today()

2021-03-15 22:20:41 141

原创 pandas将某列设为日期格式,并且提取年份作为单独列

import pandas as pd df = pd.read_excel('{}-{}.xlsx'.format(name, today), parse_dates=['净值日期']) df['年'] = df.净值日期.dt.year print(df)

2021-03-14 11:49:23 1508

原创 线性回归方程式

from scipy.stats import linregress#线性回归方程slope,intercept,r,p,std_err = linregress(df.index,df.数量)exp = df.index*slope+intercept

2021-03-13 22:30:22 249

原创 matplotlib绘制X轴密度

_xticks = ['2017年{}月'.format(i) for i in range(2, 13)]_xticks += ['2018年{}月'.format(i) for i in range(1, 13)]_xticks += ['2019年{}月'.format(i) for i in range(1, 13)]_xticks += ['2020年{}月'.format(i) for i in range(1, 13)]plt.xticks(df_retail2017_2020.日期[

2021-03-13 22:24:36 902

原创 如果文件夹内已经有文件了,就取消

import os if os.path.exists(''文件路径包括文件名及后缀) : print('{}已经下载过了,不重复下载了!'.format(文件名))

2021-03-13 21:19:06 61

原创 Python创建文件夹并且保存视频

import ospath = 'Marketing'if path not in os.listdir():#如果Marketing文件夹不在当前目录就创建文件夹 os.mkdir(path) filepath = path + '{}.mp4'.format(video_name)

2021-03-04 21:24:23 374 1

原创 pandas 更改列明为序号,并且设置序号

df.rename(columns={'index':'序号'}, inplace=True)df['序号'] = range(1, len(df)+1)

2021-02-28 10:31:31 4133

原创 pandas判断保留某几列的NAN,删除其余的NAN行

#保留A,B,C列的NAN,删除其他所有NAN行df = df[df[‘A’ or ‘B’ or ‘C’].notnull()]

2021-02-28 10:17:45 645

原创 pandas set_option 功能

#显示所有列pd.set_option(‘Max_columns’, None)#解决数据输出时列名不对齐的问题pd.set_option(‘display.unicode.east_asian_width’, True)

2021-02-27 12:27:52 361

原创 pandas 使用vlookup并且调整列顺序并且打开除了指定列文件

import pandas as pdimport ospd.set_option('max_columns', None)os.chdir('文件路径')safe = pd.read_excel('文件1.xlsx', usecols=lambda x: x not in ['采购含税单价', '供应商', '供应商名称'])item = pd.read_excel('文件2.xlsx')[['物料编号', '供应商', '供应商名称', '采购含税单价']]safe = pd.merge(l

2021-02-03 12:23:36 149

原创 pandas 条件筛选

import pandas as pdimport osos.chdir('路径')#条件筛选方案一def age_18_to_30(a): return 18 <= a < 30def level_a(s): return 85 <= s <= 100p8 = pd.read_excel('P8.xlsx',index_col='ID')p8 = p8.loc[p8.Age.apply(age_18_to_30)].loc[p8.Score.apply

2021-01-05 20:39:49 137

原创 pandas 排序

import pandas as pdimport osos.chdir('路径')p = pd.read_excel('P7.xlsx',index_col='ID')#开始多重排序p.sort_values(by=['Worthy', 'Price'], inplace=True, ascending=[True, False])print(p)

2021-01-05 20:23:52 44

原创 pandas列操作

import pandas as pdimport matplotlib.pyplot as pltimport matplotlibimport numpy as npimport ospd.set_option('display.max_columns',None)pd.set_option('display.max_rows',None)os.chdir(r'文件路径')df1 = pd.read_excel(r'students.xlsx',sheet_name='page_001'

2020-12-02 21:54:51 145 1

原创 pandas行操作

import pandas as pdimport os#完整显示列pd.set_option('display.max_columns',None)#完整显示行pd.set_option('display.max_rows',None)os.chdir(r'文件路径')df1 = pd.read_excel('students.xlsx',sheet_name='page_001')df2 = pd.read_excel('students.xlsx',sheet_name='page_0

2020-12-01 22:03:58 355

原创 pandas行列转换

import pandas as pdimport osos.chdir(r'文件路径')videos = pd.read_excel(r'Videos.xlsx',index_col='Month')#设置完整显示pd.options.display.max_columns=999#进行行列转换方法一df1 = videos.transpose()#进行行列转换方法二df2 = videos.Tprint(df2)...

2020-11-26 20:31:23 1025

原创 pandas找到及删除重复数据

import pandas as pdimport osos.chdir(r'文件路径')students = pd.read_excel(r'Students_Duplicates.xlsx')#删除Name列重复的数据,keep='last'保存最后的数据students.drop_duplicates(subset='Name',inplace=True,keep='last')#判断是否存在重复数据,True代表重复,False代表不重复dupe = students.duplicat

2020-11-26 20:11:11 160

原创 pandas多表联合join及merge

students = pd.read_excel('Student_Score.xlsx',sheet_name='Students',index_col='ID')scores = pd.read_excel('Student_score.xlsx',sheet_name='Scores',index_col='ID')# #merge多表联合how='left'表示不管对不对,按照左边的表保留数据# table = students.merge(scores,how='left',left_on=

2020-11-24 23:10:21 909

原创 matplotlib折线图绘制

import matplotlib.pyplot as pltimport matplotlib#设置图形框大小plt.figure(figsize=(20,8),dpi=80)#绘制折线图'o'设置为圆点加折线plt.plot(x2018,y2018,marker='o',label='2018年')#变更X轴显示内容_xticks = ['{}月'.format(i) for i in range(1,13)]#设置X轴内容plt.xticks(x2018,_xticks)#设置标题

2020-11-18 21:09:53 141

原创 pandas 文件读取及导入指定列

import pandas as pdimport osos.chdir('C:\pythonProject\python_work')#读取excel文件,设置index列,将创建日期列设置为日期格式 没有列名的时候使用header=Nonedf = pd.read_excel('1.xlsx',index_col='创建日期',parse_dates=['创建日期'])print(df.index)#函数主要参数#sep 指定分隔符,可用正则表达式如'\s+'#header=None 指

2020-11-17 22:04:44 922

原创 pandas索引

#读取某个单元格df.[‘a’][‘1’]df.loc[‘1’,:]df.loc[[‘1’,‘2’],‘a’]

2020-11-16 20:12:48 38

原创 pandas DataFrame常用属性

#获取索引df.index#转置,行列转换df.T#获取列索引df.columns#获取值数组df.values#获取快速统计df.describe()

2020-11-15 22:06:21 93

原创 pandas DataFrame创建

#创建dataframe数据,abc为列表头,index=[1,2,3]为行表头df = pd.DataFrame({‘a’:[1,2,3],‘b’:[4,5,6],‘c’:[7,8,9],index=[1,2,3]})#读取文件df = pd.read_excel(‘文件路径’)#保存文件df.to_excel(‘保存路径’)

2020-11-15 21:51:58 82

原创 pandas series缺失值错误值nan的处理

#如果是nan会返回False,没有nan返回Truedf.isnull()#如果是nan会返回True,没有nan返回Falsedf.notnull()#提取值,剔除nan值df[df.notnull()]#提取值,剔除nan值df.dropna()

2020-11-15 21:09:13 2065

原创 pandas绘制饼图

import pandas as pdimport matplotlib.pyplot as pltimport matplotlibimport osos.chdir(r’C:\pythonProject\python_work’)df = pd.read_excel(‘2017-2020.xlsx’)font = {‘family’: ‘宋体’,‘weight’: ‘bold’,‘size’: ‘larger’}matplotlib.rc(‘font’,family=‘Microsof

2020-11-12 23:01:49 1322

原创 pandas绘制叠加柱状图水平叠加柱状图

import pandas as pdimport osimport matplotlib.pyplot as pltimport matplotlib#设置matplotlib字体,直接复制即可font = {‘family’: ‘宋体’,‘weight’: ‘bold’,‘size’: ‘larger’}matplotlib.rc(‘font’,family=‘Microsoft YaHei’,weight=‘bold’)#设置打开文件地址os.chdir(r’C:\pythonPr

2020-11-11 23:04:45 2331 1

原创 pandas新增列并且重新排序

import pandas as pdimport osimport matplotlib.pyplot as pltimport matplotlib#设置matplotlib字体,直接复制即可font = {‘family’: ‘宋体’,‘weight’: ‘bold’,‘size’: ‘larger’}matplotlib.rc(‘font’,family=‘Microsoft YaHei’,weight=‘bold’)#设置打开文件地址os.chdir(r’C:\pythonPr

2020-11-11 22:35:13 1593

原创 pandas设置日期为筛选方式重新定义Data

import pandas as pdimport os#设置文件访问地址os.chdir(r’C:\pythonProject\python_work’)#读取excel文件,设置序号列为indexdf = pd.read_excel(‘1.xlsx’,index_col=‘序号’)#筛选需要的信息df = df[[‘请求者’,‘创建日期’]]#设置创建日期列为日期格式df[‘创建日期’] = pd.to_datetime(df[‘创建日期’])#将创建日期设置为索引df = df.

2020-11-09 23:04:38 169 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除