- 博客(34)
- 收藏
- 关注
原创 matplotlib折线图显示数据
for a, b in zip(df.index, df['2021年数量']): plt.text(a, b+100, '%.0f副' % b, ha='center', va='bottom', fontsize=10, color='red')
2021-06-13 11:11:55 2409
原创 Python 使用多线程为MP4视频添加水印logo
import osimport threadingfrom threading import Threadimport moviepy.editor as mpimport cv2logo_path = './logo/白色logo.png'save_path = './添加logo的视频'lock = threading.Lock()def get_files(): # 新建空文件列表 files_list = [] # 使用os.listdir()获取当前文件夹内
2021-05-22 10:50:43 580
原创 python openpyxl 自动设置excel列宽及行高,单元格对对齐方式
import pandas as pdfrom openpyxl import load_workbookfrom openpyxl.utils import get_column_letter# 自动设置excel列宽def auto_width(filename='合并.xlsx'): # 打开xlsx文件 wb = load_workbook(filename) # 遍历sheet for sheet in wb.sheetnames: ws =
2021-05-11 21:51:28 9818 1
原创 python获取当前文件夹及子文件夹内所有文件及路径
import osdef get_file(): # 定义路径 path='./' # 设置空列表 file_list=[] # 使用os.walk获取文件路径及文件 for home, dirs, files in os.walk(path): # 遍历文件名 for filename in files: # 将文件路径包含文件一同加入列表 file_list.append(o
2021-05-09 22:21:44 1079
原创 time data None doesn‘t match format specified报错解决办法
用python处理数据分析时出现以下错误time data None doesn’t match format specified经过CSDN各种搜索发现需要在to_datetime内添加errors='coerce’即可解决但是日期格式仍旧冥顽不灵无法变更再次使用dt.strftime来转换日期格式总算解决问题了 df['需求输入'] = pd.to_datetime(df['需求输入'], format='%Y-%m-%d',errors='coerce') df['预计日期'
2021-05-09 11:12:58 6076
原创 Python使用Image函数批量给图片添加全屏45度透明logo图片水印
from PIL import Imagefrom glob import globimport os#找到文件内jpg和PNG后缀的文件image_path = glob('*[jpg,png]')#保存处理后文件的文文件夹save_path = '.\\有水印图片'#logo文件所在路径logo_path = '.\\logo\水印.png'#定义logo满屏处理函数def make_logo(logo_path=logo_path): #打开logo文件 log
2021-04-24 22:20:13 456 1
原创 批量降低多种后缀图片分辨率并保存
from glob import globfrom PIL import Imageimport os'''使用glob获取当前文件夹内jpg及png文件,可以添加多种图片格式'''img_path = glob('*[jpg,png]')'''添加处理后保存路径文件夹'''path_save = '.\\处理后文件''''如果文件夹不存在就创建文件夹'''if not os.path.exists(path_save): os.mkdir(path_save)'''使用for循环
2021-04-22 22:16:30 124
原创 pandas将某列设为日期格式,并且提取年份作为单独列
import pandas as pd df = pd.read_excel('{}-{}.xlsx'.format(name, today), parse_dates=['净值日期']) df['年'] = df.净值日期.dt.year print(df)
2021-03-14 11:49:23 1608
原创 线性回归方程式
from scipy.stats import linregress#线性回归方程slope,intercept,r,p,std_err = linregress(df.index,df.数量)exp = df.index*slope+intercept
2021-03-13 22:30:22 265
原创 matplotlib绘制X轴密度
_xticks = ['2017年{}月'.format(i) for i in range(2, 13)]_xticks += ['2018年{}月'.format(i) for i in range(1, 13)]_xticks += ['2019年{}月'.format(i) for i in range(1, 13)]_xticks += ['2020年{}月'.format(i) for i in range(1, 13)]plt.xticks(df_retail2017_2020.日期[
2021-03-13 22:24:36 960
原创 如果文件夹内已经有文件了,就取消
import os if os.path.exists(''文件路径包括文件名及后缀) : print('{}已经下载过了,不重复下载了!'.format(文件名))
2021-03-13 21:19:06 78
原创 Python创建文件夹并且保存视频
import ospath = 'Marketing'if path not in os.listdir():#如果Marketing文件夹不在当前目录就创建文件夹 os.mkdir(path) filepath = path + '{}.mp4'.format(video_name)
2021-03-04 21:24:23 442 1
原创 pandas 更改列明为序号,并且设置序号
df.rename(columns={'index':'序号'}, inplace=True)df['序号'] = range(1, len(df)+1)
2021-02-28 10:31:31 4384
原创 pandas判断保留某几列的NAN,删除其余的NAN行
#保留A,B,C列的NAN,删除其他所有NAN行df = df[df[‘A’ or ‘B’ or ‘C’].notnull()]
2021-02-28 10:17:45 673
原创 pandas set_option 功能
#显示所有列pd.set_option(‘Max_columns’, None)#解决数据输出时列名不对齐的问题pd.set_option(‘display.unicode.east_asian_width’, True)
2021-02-27 12:27:52 395
原创 pandas 使用vlookup并且调整列顺序并且打开除了指定列文件
import pandas as pdimport ospd.set_option('max_columns', None)os.chdir('文件路径')safe = pd.read_excel('文件1.xlsx', usecols=lambda x: x not in ['采购含税单价', '供应商', '供应商名称'])item = pd.read_excel('文件2.xlsx')[['物料编号', '供应商', '供应商名称', '采购含税单价']]safe = pd.merge(l
2021-02-03 12:23:36 169
原创 pandas 条件筛选
import pandas as pdimport osos.chdir('路径')#条件筛选方案一def age_18_to_30(a): return 18 <= a < 30def level_a(s): return 85 <= s <= 100p8 = pd.read_excel('P8.xlsx',index_col='ID')p8 = p8.loc[p8.Age.apply(age_18_to_30)].loc[p8.Score.apply
2021-01-05 20:39:49 153
原创 pandas 排序
import pandas as pdimport osos.chdir('路径')p = pd.read_excel('P7.xlsx',index_col='ID')#开始多重排序p.sort_values(by=['Worthy', 'Price'], inplace=True, ascending=[True, False])print(p)
2021-01-05 20:23:52 59
原创 pandas列操作
import pandas as pdimport matplotlib.pyplot as pltimport matplotlibimport numpy as npimport ospd.set_option('display.max_columns',None)pd.set_option('display.max_rows',None)os.chdir(r'文件路径')df1 = pd.read_excel(r'students.xlsx',sheet_name='page_001'
2020-12-02 21:54:51 207 1
原创 pandas行操作
import pandas as pdimport os#完整显示列pd.set_option('display.max_columns',None)#完整显示行pd.set_option('display.max_rows',None)os.chdir(r'文件路径')df1 = pd.read_excel('students.xlsx',sheet_name='page_001')df2 = pd.read_excel('students.xlsx',sheet_name='page_0
2020-12-01 22:03:58 396
原创 pandas行列转换
import pandas as pdimport osos.chdir(r'文件路径')videos = pd.read_excel(r'Videos.xlsx',index_col='Month')#设置完整显示pd.options.display.max_columns=999#进行行列转换方法一df1 = videos.transpose()#进行行列转换方法二df2 = videos.Tprint(df2)...
2020-11-26 20:31:23 1058
原创 pandas找到及删除重复数据
import pandas as pdimport osos.chdir(r'文件路径')students = pd.read_excel(r'Students_Duplicates.xlsx')#删除Name列重复的数据,keep='last'保存最后的数据students.drop_duplicates(subset='Name',inplace=True,keep='last')#判断是否存在重复数据,True代表重复,False代表不重复dupe = students.duplicat
2020-11-26 20:11:11 192
原创 pandas多表联合join及merge
students = pd.read_excel('Student_Score.xlsx',sheet_name='Students',index_col='ID')scores = pd.read_excel('Student_score.xlsx',sheet_name='Scores',index_col='ID')# #merge多表联合how='left'表示不管对不对,按照左边的表保留数据# table = students.merge(scores,how='left',left_on=
2020-11-24 23:10:21 934
原创 matplotlib折线图绘制
import matplotlib.pyplot as pltimport matplotlib#设置图形框大小plt.figure(figsize=(20,8),dpi=80)#绘制折线图'o'设置为圆点加折线plt.plot(x2018,y2018,marker='o',label='2018年')#变更X轴显示内容_xticks = ['{}月'.format(i) for i in range(1,13)]#设置X轴内容plt.xticks(x2018,_xticks)#设置标题
2020-11-18 21:09:53 180
原创 pandas 文件读取及导入指定列
import pandas as pdimport osos.chdir('C:\pythonProject\python_work')#读取excel文件,设置index列,将创建日期列设置为日期格式 没有列名的时候使用header=Nonedf = pd.read_excel('1.xlsx',index_col='创建日期',parse_dates=['创建日期'])print(df.index)#函数主要参数#sep 指定分隔符,可用正则表达式如'\s+'#header=None 指
2020-11-17 22:04:44 955
原创 pandas DataFrame常用属性
#获取索引df.index#转置,行列转换df.T#获取列索引df.columns#获取值数组df.values#获取快速统计df.describe()
2020-11-15 22:06:21 109
原创 pandas DataFrame创建
#创建dataframe数据,abc为列表头,index=[1,2,3]为行表头df = pd.DataFrame({‘a’:[1,2,3],‘b’:[4,5,6],‘c’:[7,8,9],index=[1,2,3]})#读取文件df = pd.read_excel(‘文件路径’)#保存文件df.to_excel(‘保存路径’)
2020-11-15 21:51:58 110
原创 pandas series缺失值错误值nan的处理
#如果是nan会返回False,没有nan返回Truedf.isnull()#如果是nan会返回True,没有nan返回Falsedf.notnull()#提取值,剔除nan值df[df.notnull()]#提取值,剔除nan值df.dropna()
2020-11-15 21:09:13 2130
原创 pandas绘制饼图
import pandas as pdimport matplotlib.pyplot as pltimport matplotlibimport osos.chdir(r’C:\pythonProject\python_work’)df = pd.read_excel(‘2017-2020.xlsx’)font = {‘family’: ‘宋体’,‘weight’: ‘bold’,‘size’: ‘larger’}matplotlib.rc(‘font’,family=‘Microsof
2020-11-12 23:01:49 1363
原创 pandas绘制叠加柱状图水平叠加柱状图
import pandas as pdimport osimport matplotlib.pyplot as pltimport matplotlib#设置matplotlib字体,直接复制即可font = {‘family’: ‘宋体’,‘weight’: ‘bold’,‘size’: ‘larger’}matplotlib.rc(‘font’,family=‘Microsoft YaHei’,weight=‘bold’)#设置打开文件地址os.chdir(r’C:\pythonPr
2020-11-11 23:04:45 2428 1
原创 pandas新增列并且重新排序
import pandas as pdimport osimport matplotlib.pyplot as pltimport matplotlib#设置matplotlib字体,直接复制即可font = {‘family’: ‘宋体’,‘weight’: ‘bold’,‘size’: ‘larger’}matplotlib.rc(‘font’,family=‘Microsoft YaHei’,weight=‘bold’)#设置打开文件地址os.chdir(r’C:\pythonPr
2020-11-11 22:35:13 1666
原创 pandas设置日期为筛选方式重新定义Data
import pandas as pdimport os#设置文件访问地址os.chdir(r’C:\pythonProject\python_work’)#读取excel文件,设置序号列为indexdf = pd.read_excel(‘1.xlsx’,index_col=‘序号’)#筛选需要的信息df = df[[‘请求者’,‘创建日期’]]#设置创建日期列为日期格式df[‘创建日期’] = pd.to_datetime(df[‘创建日期’])#将创建日期设置为索引df = df.
2020-11-09 23:04:38 186 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人