Python
qq_27866857
这个作者很懒,什么都没留下…
展开
-
iris 鸢尾花数据集&画图
import seaborn as snssns.set(style=“whitegrid”, palette=“husl”)iris = sns.load_dataset(“iris”)print (iris.head())print (iris.feature_names) # input namesprint (iris.target_names) # output namesprint (iris.DESCR) # everything elseiris = pd.melt(iris, “s原创 2022-09-09 11:35:35 · 723 阅读 · 0 评论 -
Python 获取当前脚本所在的路径
Python脚本路径原创 2022-06-19 16:33:44 · 1426 阅读 · 0 评论 -
Python 批量读取文件夹中的excel
path=r'D:\20201015'files=os.listdir(path)alldata=pd.DataFrame()for file in files[1:-1]:# print(file) data=pd.read_csv(file,header=None,error_bad_lines=False,encoding='utf-8')# data=data[[0,4,11]]# data.columns=['applyId','sj','desc.原创 2022-04-24 03:12:12 · 3997 阅读 · 0 评论 -
Python dataframe_去重复列_列名vlookup且替换
1、dataframe去掉列重复的,以(_y)结束的列2、以_x结尾的列去掉 _x3、列名加上中文(中引文字段名)先列名取出来,用dataframe处理,再取dataframe处理好的那列作为列名原创 2022-04-14 15:34:11 · 1526 阅读 · 0 评论 -
类别不平衡问题之SMOTE算法(Python imblearn极简实现)
类别不平衡问题注1:x均转为为float类型才行注:自己电脑上,做以下改动方可用fit_sample 改为 fit_resampleratio={1: 300 } 改为 sampling_strategy={4:94}类别不平衡问题,顾名思义,即数据集中存在某一类样本,其数量远多于或远少于其他类样本,从而导致一些机器学习模型失效的问题。例如逻辑回归即不适合处理类别不平衡问题,例如逻辑回归在欺诈检测问题中,因为绝大多数样本都为正常样本,欺诈样本很少,逻辑回归算法会倾向于把大多数样本判定为正常样原创 2022-03-30 17:46:32 · 1778 阅读 · 1 评论 -
Python 索引index相关
1、将列转为indexdf.set_index('sp',inplace=True) #原有的sp列会被删除df.index=df['sp'] #原有的sp列会保留2、将index转列df['sp']=df.index 3、删除原有的sp的index,重新为1234df=df.reset_index(drop=True) #要有等号df=df...原创 2022-03-23 23:29:40 · 776 阅读 · 0 评论 -
Python上安装xgboost
用anaconda的亲测有效:打开anaconda自带的Prompt,输入anaconda search -t conda xgboost在里面找到可以在win64上安装的包的名字,应该是“anaconda py-xgboost”,输入conda install -c anaconda py-xgboost原创 2022-03-14 17:50:56 · 2089 阅读 · 0 评论 -
python生成时间列表
python生成时间列表yearmonthday = pd.date_range(“2020-07-01”,“2020-12-31”,freq=“D”).strftime("%Y%m%d").to_list()month = pd.date_range(“2020-07-01”,“2020-12-31”,freq=“M”).strftime("%Y%m").to_list()day = pd.date_range(“2020-07-01”,“2020-12-31”,freq=“D”).strftime原创 2022-01-24 10:35:15 · 1268 阅读 · 0 评论 -
Python 针对某一列
ll=data.loc[ :,data.columns!=‘客户数据编号’]原创 2022-01-20 17:43:30 · 493 阅读 · 0 评论 -
Python 生成连续月份列表
pd.date_range('2014-10-10','2016-01-07', freq='MS').strftime("%Y-%m").tolist()原创 2021-11-30 16:28:07 · 1582 阅读 · 0 评论 -
Spyder打开多个窗口运行多个程序
问题:spyder所有的执行结果都在一个结果窗口中,同时处理2个事情比较容易混乱,或者其中一个脚本执行时间很长,就无法做其他事情。解决:1、第一个窗口,快捷方式,正常打开的方式;2、第二个窗口,打开Anaconda Prompt终端,通过activate命令激活想要使用的环境(如 activate tensorflow2),输入:spyder --new-instance或spyder --new instance就可以打开另外一个窗口;重复第二个窗口的打开方式,就可以打开更多的窗口。...原创 2021-11-28 15:08:01 · 5132 阅读 · 0 评论 -
Python dataframe 字符型数字转数字型
data[’’].fillna(0).apply(pd.to_numeric)原创 2021-11-25 14:26:41 · 4436 阅读 · 0 评论 -
tuple转dataframe
python read_sql以后结果不是dataframe,而是tuple,所以要转。但是转化以后没有列名。。。。import pandas as pds = ((1,0,0,0,),(2,3,0,0,),(4,5,6,0,),(7,8,9,10,))print pd.DataFrame(list(s))原创 2021-11-22 18:23:50 · 3005 阅读 · 0 评论 -
python dataframe取最后一行非空值,loc可以数字和中文结合取
原创 2021-11-21 18:07:10 · 2608 阅读 · 0 评论 -
python 删除 DataFrame表的最后一行的正确方法
import pandas as pdimport numpy as npdf = pd.DataFrame(np.arange(12).reshape(3,4), columns=['A', 'B', 'C', 'D'])print("df",df) # df.drop([-1],inplace=True)df.drop([len(df)-1],inplace=True)print("df",df)注意不要用df.drop([-1],inplace=True),这个写法不对...转载 2021-11-21 17:43:57 · 2862 阅读 · 0 评论 -
python 生成一个时间列表-本月截至当前(1号则为上月)relativedelta,当前时间为基础加减
需求:生成月初至昨天的日报,若今日为1号,则为上月整月的数据from datetime import datetimefrom dateutil.relativedelta import relativedeltaimport pandas as pdedate=datetime.today().date()+relativedelta(days=-1)bdate=datetime(edate.year,edate.month,1)date_l=pd.date_range(bdate,edate原创 2021-11-21 16:55:26 · 289 阅读 · 0 评论 -
python dataframe 某一列string转int 字符转数字 python could not convert string to float
df_raw['PricePerSeat_Outdoor'] = df_raw['PricePerSeat_Outdoor'].apply(pd.to_numeric,errors='coerce'),errors=‘coerce’ 未知可不加原创 2021-11-21 15:18:22 · 5009 阅读 · 0 评论 -
python对dataframe列内的数据处理 str
pandas的DataFrame,有时需要处理一些字符串类型列,运用Series.str列内置方法很方便。1.one hot 独热编码,get_dummiesseries=data[‘列名’].str.get_dummies(sep=’,’)实现DataFrame中列有多值,且想把这列one hot下2.切分字符串,split()series=data[‘列名’].str.split(’,’)把DataFrame列中字符串以’,'分隔开,每个元素分开后存入一个列表里series=data[‘列转载 2021-01-29 11:38:24 · 2077 阅读 · 0 评论 -
python gc模块垃圾回收
#加载gc模块import gc#垃圾回收#gc.collect() 返回处理这些循环引用一共释放掉的对象个数gc.collect()原创 2021-11-17 11:07:04 · 147 阅读 · 0 评论 -
python数据处理——获得pandas dataframe中字符串里的数字 str.extract
for i in df.columns:df[i] = df[i].str.extract(’(\d+)’)原创 2021-11-13 16:47:11 · 4218 阅读 · 0 评论 -
Python apply,applymap和map的应用
#apply,applymap和map的应用apply 用在dataframe上,用于对row或者column进行计算;applymap 用于dataframe上,是元素级别的操作;map (其实是python自带的)用于series上,是元素级别的操作。原创 2021-11-13 16:43:56 · 331 阅读 · 0 评论 -
python中的数据透视表pivot_table
index:行values:列aggfunc:列的操作columns:对列再细分,可省略#pivot aggfunc转置rfm = df.pivot_table(index = 'user_id', values = ['order_products', 'order_amount', 'order_dt'], aggfunc = {'order_dt':'max', 'order_amount':'sum', 'order_products':'sum' }) ......原创 2021-11-13 16:42:59 · 335 阅读 · 0 评论 -
Python df.groupby(a,as_index=False)[‘‘].sum().sort_values(‘‘,ascending=False).reset_index(drop=True)
#as_index=False结果的列名与之前一致aa=chipo.groupby(['item_name'],as_index=False)['quantity'].sum() #大类的销售金额 reset_index(drop=True) 删除原indexdaleijine=df.groupby(['大类名称'],as_index=False)['销售金额'].sum().sort_values(['销售金额'],ascending=False).reset_index(drop=True)原创 2021-11-13 16:15:11 · 1201 阅读 · 0 评论 -
Python with pd.ExcelWriter(‘a.xls‘) as writer: 新建excel文件,保存2个sheet
import pandas as pdnew1 = pd.DataFrame({0:['a','b','c'], 1:['q1','q2','q3'], 2:['t3','t2','t1']})new2 = pd.DataFrame({0:['aq1','bq2','cq3'], 1:['la1','la2','la3']})with pd.ExcelWriter('a.xls') as writer: new1.to_excel(writer, 'sheet1') new2.to原创 2021-11-13 16:10:20 · 5625 阅读 · 0 评论 -
python schedule模块定时执行任务
import scheduleimport timedef job(): print("I'm working...")schedule.every(10).minutes.do(job)schedule.every().hour.do(job)schedule.every().day.at("10:30").do(job)schedule.every().monday.do(job)schedule.every().wednesday.at("13:15").do(job)w原创 2021-08-25 03:20:56 · 79 阅读 · 0 评论 -
python dataframe isin()实现sql的in
huitong[huitong['编号'].isin(['68','27'])]原创 2021-11-13 16:01:03 · 1431 阅读 · 0 评论 -
Python 自动发邮件+附件
# -*- coding: utf-8 -*-"""Created on Fri Nov 5 18:10:00 2021@author: yalan.pan"""import win32com.client as win32import warningsimport sysimport pythoncomimport importlibimportlib.reload(sys)warnings.filterwarnings('ignore')pythoncom.CoIniti原创 2021-11-05 18:27:53 · 244 阅读 · 0 评论