![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据预处理
主要涉及数据的预处理以及二次加工等
zzb103749
用大数据绘制未来的蓝图。
展开
-
matplotlib学习教程
一、Python编程基础1、编程语言编程语言适用于和机器进行沟通,常见的语言有C、C++、Java、Python等。编程语言按类型分成两类: ...原创 2022-01-15 14:30:04 · 457 阅读 · 0 评论 -
pandas研究
Pandas Series入门教程原创 2022-01-15 00:07:17 · 446 阅读 · 0 评论 -
mysql
第一章:了解SQL(通常数据库称为数据库管理系统 DBMS)数据库:以某种有组织的方式存储数据。 数据库:存储数据的容器; 表:数据库中信息的载体; 列和数据类型:列是指具体字段,类型是数据的类型(文档、数值型等); 行:一条数据记录; 主键:为每条数据记录赋予唯一地址,区分不同行;第二章:MySql介绍 1、...原创 2021-11-19 09:36:08 · 265 阅读 · 0 评论 -
1、Python中类的学习
class student: #定义类 student_count=0 #定义类变量 def __init__(self, name, age): #类的初始化 self.name = name self.age = age student.student_count += 1 def dis_student(self): #定义类的实例 print("student name is "+sel...原创 2021-11-19 09:35:15 · 509 阅读 · 0 评论 -
numpy的学习
#Python的学习:numpy学习import numpy as npimport matplotlib as mplfrom mpl_toolkits.mplot3d import Axes3Dfrom matplotlib import cmimport timefrom scipy.optimize import leastsqfrom scipy import statsimport scipy.optimize as optimport matplotli..原创 2021-11-19 09:32:02 · 329 阅读 · 0 评论 -
DataFrame基本操作
其实代码就是按照人的思维编写的底层,所有的函数都是按照人类的认知定义的。1、读取表,设置类索引和行索引datas=pd.DataFrame(数据表,index=list(''),columns=list(''))eg:df1 = pd.DataFrame(np.random.randn(3, 3), index=list('abc'), columns=list('ABC'))2、格式化函数 .format()格式化字符串函数str.format()将对应的字段转化成个性化的原创 2021-11-17 11:10:40 · 6122 阅读 · 0 评论 -
数据预处理过程中处理方法
1、初次清洗,DataFrame中存在数值型字段和非数字型字段技巧1)将训练集和测试集数据进行合并,统一处理dataset=pd.concat([train_data,test_data],axis=0)2)识别数值型字段和非数值型字段number_feats = dataset.dtypes[dataset.dtypes != "object"].indexobject_feats = dataset.dtypes[adataset.dtypes == "object"].index原创 2021-11-17 11:11:34 · 485 阅读 · 0 评论 -
建模过程中的疑问记录
1、连接数据库,接入数据并且转化成dataframe 形式,采用以下语句dataset=pd.DataFrame(list(cursor.fetchall()),columns=['tjsj','gmyszzyzs','gyydl'])说明:运行SQL语句后,必须转化后才能list,最好附带列名columns,生成期望的dataframe进行及进一步的处理加工。2、数据中空缺值填充data=dataset.fillna(method='bfill')说明:1)method参数的取值.原创 2021-11-17 11:11:52 · 244 阅读 · 0 评论