![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python
LL_QQ63
数据爱好者,算法求解中。。。。。。
展开
-
自然月日期
from calendar import Calendarimport datetimec = Calendar(firstweekday=6)list_day=[]for item in c.itermonthdates(2018,8): #print(item) #print(item.month) if item.month==8: list_day.append(item)原创 2021-04-06 17:33:16 · 176 阅读 · 0 评论 -
python describe
#针对变量较多,describe方法无法完全显示,因此写自定义函数,查看数值型数据中的数据分布情况#需要计算的指标:均值mean、方差std、最小值min、import numpy as npimport pandas as pdfrom scipy import statsdata=pd.read_csv()def desc(data): #筛选出数值型的数据 df=data.copy() #新建一个DataFrame,记载各变量的数据类型,便于后续筛选 .原创 2021-03-25 14:14:30 · 1062 阅读 · 0 评论 -
python分箱
为便于工作中计算KS和IV等值,编写一套可以沿用的代码,方便随时使用。#第一步,读取数据import pandas as pdimport numpy as npdf=pd.read_excel(r'C:\Users\***\a.xlsx')#第二步:查看所有字段的字段类型df.dtypes#新建一个DataFrame,记载各变量的数据类型,便于后续筛选df_var=pd.DataFrame(df.columns,columns=['var'])df_type=pd.DataFr原创 2020-11-23 18:12:39 · 2658 阅读 · 3 评论 -
KNN 鸢尾花&癌症预测 交叉验证&网格搜索 笔记
一、交叉验证 cross_val_score:sklearn.cross_validation.cross_val_score(estimator, X, y=None, scoring=None, cv=None, n_jobs=1, verbose=0, fit_params=None, pre_dispatch=‘2*n_jobs’)参数estimator:数据对象X:...原创 2020-02-08 19:32:25 · 576 阅读 · 0 评论 -
.python 简单小练习
1.九九乘法表list1=[]for i in range(1,10): list1.append(i) list1.sort(reverse=True)for m in list1: # print(m) for n in range(1,m+1): print("{}*{}={}".format(m,n,m*n),end=" ...原创 2020-01-30 18:02:09 · 113 阅读 · 0 评论 -
数据清洗与准备
1 处理缺失值1.1 过滤缺失值:dropna()1.2 补全缺失值:fillna()1.3 数据转换1.3.1 删除重复值①duplicated方法返回的是一个布尔值series;②drop_duplicates返回的是DataFrame,内容是duplicated返回数组中为False的部分;注释:duplicated和drop_duplicates...原创 2020-01-28 13:13:54 · 146 阅读 · 0 评论 -
内建数据结构、函数
一、数据结构和序列1.1元组,tuple,()#元组t1=()print(type(t1))'''<class 'tuple'>'''t2=(1)print(type(t2))'''<class 'int'>'''t3=('1')print(type(t3))'''<class 'str'>'''t4=(1,)...原创 2020-01-27 17:44:35 · 161 阅读 · 0 评论 -
python 将数据放在邮件正文发送
#需发送的数据dataimport smtplibfrom email.mime.text import MIMETextfrom email.utils import formataddrfrom email.mime.multipart import MIMEMultipartfrom email.header import Header#发件箱my_sender='~'...原创 2020-01-07 15:56:30 · 850 阅读 · 0 评论 -
小猪佩奇代码 Python
from turtle import*def nose(x,y):#鼻子 penup()#提起笔 goto(x,y)#定位 pendown()#落笔,开始画 setheading(-30)#将乌龟的方向设置为to_angle/为数字(0-东、90-北、180-西、270-南) begin_fill()#准备开始填充图形 a=0.4 for i in ...原创 2020-01-02 17:47:25 · 1949 阅读 · 0 评论 -
数据预处理总结 Python
1.数据无量纲化 在机器学习算法实践中,我们往往有着将不同规格的数据转换到同一规格,或不同分布的数据转换到某个特定分布的需求,这种需求统称为将数据“无量纲化”。进行无量纲化处理后,表征不同属性(单位不同)的各特征之间才有可比性,如1cm与 0.1kg你怎么比?通过无量纲化可以帮我们提升模型精度,避免某一个取值范围特别大的特征对距离计算造成影响。数据的无量纲化可以是线性的,也可以是非...原创 2019-12-24 18:26:15 · 1046 阅读 · 0 评论 -
等频分箱代码
如下代码,仅需将原始已处理好的需变量分析的数据读入,Y值需将字段名称修改为‘15A’即可运行。# -*- coding: utf-8 -*-""""""import pandas as pdimport numpy as npimport xlrd#from pandasql import sqldf#定义读入数据def xlsxread(self):...原创 2019-12-16 09:59:16 · 1661 阅读 · 2 评论