- 博客(4)
- 收藏
- 关注
原创 使用LightGBM和GridSearchCV预测Titanic数据集
对于Titanic数据集预测的初次尝试,主要使用的是LightGBM和GridSearchCV。这两个参数都很多,对应的文档在https://lightgbm.readthedocs.io/en/latest/Experiments.html 和 https://lightgbm.cn/docs/6/#io以及https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html常看常新吧,毕竟
2021-12-02 23:59:11 1265
原创 对DataFrame数据按列处理
对DataFrame数据按列处理获取列名使用.columns()函数。import pandas as pddf=pd.DataFrame({'id':[1,2,3,4,5],'a':[1, 3, 5, 7,9],'b':[2 , 4 , 6, 8, 19], 'c': [4, 6, 9, 12, 20],'d':['yes','yes','no','no','yes']})df id a b c d
2021-11-20 00:47:51 2395
原创 python sklearn机器学习项目流程初探
本文是python初学者上手机器学习的学习记录,重点是熟悉整个操作流程。整个流程包括数据载入,查看数据结构,划分测试集与训练集,数据探索,数据准备,选择和训练模型,交叉验证以及测试集评估算法。对于第一次上手的新手来说,还是很烦躁的。数据载入csv文件用的是pd.read_csv函数。注意文件路径中的“\”应该再使用一个“\”进行转义,或者直接换成“/”。import numpy as npimport pandas as pddata=pd.read_csv('C:\\Users\\43480
2021-11-18 21:45:37 1178
原创 pandas取dataframe特定行/列 2021-11-12
import numpy as npfrom pandas import DataFrameimport pandas as pddf=pd.DataFrame(np.random.randn(5,3),index = range(5), columns = list('abc'))df从中取出特定的行/列可以使用.loc()函数。但是.loc()有一个特性,与普通的python切片不同,起止位置的内容都会被包括。Note that contrary to usual python ..
2021-11-12 20:51:39 3652
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人