自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 使用LightGBM和GridSearchCV预测Titanic数据集

对于Titanic数据集预测的初次尝试,主要使用的是LightGBM和GridSearchCV。这两个参数都很多,对应的文档在https://lightgbm.readthedocs.io/en/latest/Experiments.html 和 https://lightgbm.cn/docs/6/#io以及https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html常看常新吧,毕竟

2021-12-02 23:59:11 1265

原创 对DataFrame数据按列处理

对DataFrame数据按列处理获取列名使用.columns()函数。import pandas as pddf=pd.DataFrame({'id':[1,2,3,4,5],'a':[1, 3, 5, 7,9],'b':[2 , 4 , 6, 8, 19], 'c': [4, 6, 9, 12, 20],'d':['yes','yes','no','no','yes']})df id a b c d

2021-11-20 00:47:51 2395

原创 python sklearn机器学习项目流程初探

本文是python初学者上手机器学习的学习记录,重点是熟悉整个操作流程。整个流程包括数据载入,查看数据结构,划分测试集与训练集,数据探索,数据准备,选择和训练模型,交叉验证以及测试集评估算法。对于第一次上手的新手来说,还是很烦躁的。数据载入csv文件用的是pd.read_csv函数。注意文件路径中的“\”应该再使用一个“\”进行转义,或者直接换成“/”。import numpy as npimport pandas as pddata=pd.read_csv('C:\\Users\\43480

2021-11-18 21:45:37 1178

原创 pandas取dataframe特定行/列 2021-11-12

import numpy as npfrom pandas import DataFrameimport pandas as pddf=pd.DataFrame(np.random.randn(5,3),index = range(5), columns = list('abc'))df从中取出特定的行/列可以使用.loc()函数。但是.loc()有一个特性,与普通的python切片不同,起止位置的内容都会被包括。Note that contrary to usual python ..

2021-11-12 20:51:39 3652

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除