自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 【DataWhale】【数据分析】Chapter 3 模型建立和评估

模型评估 模型评估是为了知道模型的泛化能力。 交叉验证(cross-validation)是一种评估泛化性能的统计学方法,它比单次划分训练集和测试集的方法更加稳定、全面。 在交叉验证中,数据被多次划分,并且需要训练多个模型。 最常用的交叉验证是 k 折交叉验证(k-fold cross-validation),其中 k 是由用户指定的数字,通常取 5 或 10。 准确率(precision)度量的是被预测为正例的样本中有多少是真正的正例 召回率(recall)度量的是正类样本中有多少被预测为正类 f-分数

2020-08-28 17:54:32 90

原创 【DataWhale】【数据分析】Chapter 2

数据清洗及特征处理 查看缺失值 df.isna().sum() df.isnull().sum() 对缺失值进行处理 请查看数据中的重复值 对年龄进行分箱(离散化)处理 将连续变量Age平均分箱成5个年龄段,并分别用类别变量12345表示 将连续变量Age划分为[0,5) [5,15) [15,30) [30,50) [50,80)五个年龄段,并分别用类别变量12345表示 将连续变量Age按10% 30% 50 70% 90%五个年龄段,并用分类变量12345表示 查看文本变量名及种类 将文本变量Se

2020-08-21 12:48:16 107

原创 【DataWhale】【数据分析】Chapter 1

数据载入及初步观察 载入数据 csv: pd.read_csv(绝对路径or相对路径) Excel: pd.read_excel() txt: pd.read_txt() 逐块读取 df = pd.read_csv('train.csv', chunksize=100) for chunk in df: print(chunk) 或者 df = pd.read_csv('train.csv', iterator=True) chunks = df.get_chunk(100) print(chunk

2020-08-19 14:31:01 146

原创 python io.path 之 split(), splitext()及join()小结

import os #os.path.join() 将分离的部分合成一个整体 filename=os.path.join(’/home/ubuntu/python_code’,‘split_func’) print filename #输出为:/home/ubuntu/python_code/split_func #os.path.splitext()将文件名和扩展名分开 fname,fename...

2019-11-28 16:22:12 205

原创 Vi总结

vi介绍 vi是编辑器是Linux系统中最常用的文件编辑器。vi有两种输入和命令两种工作模式, 当执行vi后,首先进入命令模式,此时输入的任何字符都被视为命令。 编辑文件 如果通过vi打开一个已经存在的文件,首先进入命令模式,此时输入的任何字符都被视为命令,不能输入内容。 vi插入模式 › vi 1.c +1 //表明光标在第一行 +行号 vi的退出 vi配置 ctrl + n Keyword ...

2019-11-17 21:05:49 223

原创 Linux Schedule

Linux Command Line

2019-11-17 19:56:08 291

转载 指针、引用和值传递

对于那些函数,它们只使用传递过来的值,而不对值进行修改。 (1)如果数据对象很小,如内置数据类型或小型结构,使用按值传递。 (2)如果数据对象是数组,则使用指向const的指针。 (3)如果数据对象是较大的结构,则使用const指针或者const引用,以提高程序的效率。 (4)如果数据对象是类对象,则使用const引用。因此,传递类对象参数的标准方式是按引用传递。 ...

2019-11-04 11:18:57 144

原创 输入数据的每行包含若干个(至少一个)以空格隔开的整数,输出每行中所有整数之和。(边读边算)

C:getchar()吞掉输入的空格。 #include <stdio.h> #include <string.h> #define maxn 100 int a[maxn]; int main(){ int i = 0; int sum = 0 ; char ch; do{ scanf("%d", &a[i++])...

2019-10-15 18:38:08 2564 1

原创 putchar与getchar方法小结

getchar()

2019-10-15 16:29:38 370

原创 《算法竞赛入门经典》

《算法竞赛入门经典》 本文旨在总结看书刷题过程中的重要知识点以及个人比较欠缺和薄弱的内容。 Chapter 3. 数组和字符串 3.6 环状序列 此题中出现了:字典序。字典序:在字典中,单词是按照首字母在字母表中的顺序进行排列的,比如 alpha 在 beta 之前。而第一个字母相同时,会去比较两个单词的第二个字母在字母表中的顺序,比如 account 在 advanced 之前,以此类推。 知道...

2019-10-15 15:45:21 185

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除