自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 资源 (2)
  • 收藏
  • 关注

原创 2021-09-13datawhale集成学习--机器学习数学基础笔记

正定矩阵,负定矩阵是什么意思?先来理解:1.矩阵合同(参考b站视频):2.矩阵相似3.正定矩阵,三种判定方法顺序主子式是:负正负正这样的正定的应用

2021-09-17 01:45:13 76

原创 动手学数据分析-第三章模型建立和评估

第三章模型建立和评估输出图片设置plt.rcParams[‘font.sans-serif’] = [‘SimHei’] # 用来正常显示中文标签plt.rcParams[‘axes.unicode_minus’] = False # 用来正常显示负号plt.rcParams[‘figure.figsize’] = (10, 6) # 设置输出图片大小特征工程1.缺失值填充2.编码分类变量onehot encoding# 取出所有的输入特征data = train[['Pclass

2021-07-23 00:09:24 134 1

原创 2021-07-19动手学数据分析第二章:第四节数据可视化

画图在jupyter中显示%matplotlib inline导入画图用的包,import matplotlib.pyplot as plttext = pd.read_csv(r’result.csv’)r就是原模原样的读取,不转义,否则路径中/会被当成转义字符2.7.2 任务二:可视化展示男女中生存人数分布情况(用柱状图试试)。sex = text.groupby('Sex')['Survived'].sum()sex.plot.bar()plt.title('survived_cou

2021-07-19 21:47:55 217

原创 动手学数据分析第二节数据重构

#数据重构2.4 数据的合并2.4.2:任务二:使用concat方法:*注意:横向合并要加axis=1,纵向合并不需要,默认的。数据列分布在不同的csv文件里了,要合并回一起使用concat方法:将数据train-left-up.csv和train-right-up.csv横向合并为一张表list_up = [text_left_up,text_right_up]result_up = pd.concat(list_up,axis=1)result_up.head()使用上面同样的方法

2021-07-17 20:38:32 95

原创 datawhale动手学数据分析-task2

Task02: 数据清洗及特征处理2天)(第二章第1节)2.1 缺失值观察与处理¶df.info()df.isnull().sum()对缺失值进行处理个人习惯:df[‘Age’]=df[‘Age’].fillna(0)df[df[‘Age’].isnull()] = 0学到的新方式:df[df[‘Age’] == np.nan] = 0df[df[‘Age’]==None]=0这些哪个更好,不清楚2.2 重复值观察与处理df[df.duplicated()]df = df.dro

2021-07-14 15:41:21 77

原创 2021-07-13 dataWhale数据分析第一单元

第一单元--使用kaggle上的泰坦尼克数据进行EDA第一章:第一节数据载入及初步观察第一章:第二节pandas基础第一章:第三节探索性数据分析)第一章:第一节数据载入及初步观察这个数据我以前就看过它的eda的示例,非常适合入门。datawhale提供的文档里包含了一个代码是空,配合注释的,和一个代码写好了的。在代码为空的地方先自己做,再去对答案,查漏补缺。下面记录一下我需要注意改进的地方:之前用的比较多的是df.describe() 和df.dtypes。这里用df.info()就可以看

2021-07-13 20:55:45 84

原创 2021-5-3 pytorch的win cpu版安装

如果有GPU,需要按照CUDA和CuDNN没有,直接从https://download.pytorch.org/whl/torch_stable.html,根据选择cpu版,win操作系统,下载whl文件。安装whl报错检查一下python版本是不是对不上我的python是3.7版本,所以下载链接要选带cp37的,而不是cp36.torch版本也选择一个新一点的torch-1.5.0+cpu-cp37-cp37m-win_amd64.whl安装成功!pip list检

2021-05-03 07:36:52 106

原创 20200805学习笔记

#背单词#算法##看书CRACKING the · CODING INTERVIEW 第六章大O###big O, big theta, and big omega####In academia:big O describes an upper bound on the time.big omega is the equivalent concept but for lower bound.big theta means both O and omega . gives a tight bou

2020-08-05 21:59:02 279

原创 Datawhale 零基础入门CV赛事-Task5 模型集成

集成学习方法在机器学习中的集成学习可以在一定程度上提高预测精度,常见的集成学习方法有Stacking、Bagging和Boosting,同时这些集成学习方法与具体验证集划分联系紧密。1.Stacking算法2.Bagging方法:典型的是随机森林3.Boosting方法:包括Adaboosting,提升树(代表是GBDT), XGBoost等stacking就是当用初始训练数据学习出若干个基学习器后,将这几个学习器的预测结果作为新的训练集,来学习一个新的学习器。Baggging 和Boost

2020-06-02 23:46:07 138

原创 Datawhale 零基础入门CV赛事-Task4 模型训练与验证

1.训练,验证,测试集1)训练神经网络时,我们需要做出很多决策,例如: 神经网络分多少层 每层含有多少个隐藏单元 学习速率是多少 各层采用哪些激活函数创建新应用的过程中,我们不可能从一开始就准确预测出这些信息和其他超级参数。实际上,应用型机器学习是一个高度迭代的过程,通常在项目启动时,我们会先有一个初步想法,比如构建一个含有特定层数,隐藏单元数量或数据集个数等等的神经网络,然后编码,并尝试运行这些代码,通过运行和测试得到该神经网络或这些配置信息的运行结果,你可能会根据输出结果重

2020-05-30 22:47:38 244

原创 TASK3: CNN卷积神经网络

1. 术语:CNN:卷积神经网络。即至少有一个卷积层的网络。典型的 CNN 还包括其他类型的层级,例如池化层和密集层。卷积:向图像应用核(滤波器)的过程核/滤波器:小于输入的矩阵,用于将输入变成多个小区域填充:在输入图像周围添加像素,像素值通常为 0池化:通过下采样降低图像大小的过程。池化层有多种类型。例如,平均池化通过求平均值将多个值变成一个值。但是最大池化是最常见的池化类型。最大池化:一种池化过程,通过获取多个值中的最大值,将多个值变成一个值。步长:在图像上滑动核(滤波器)的间隔像素数量

2020-05-26 22:03:45 197

原创 街景字符识别--Task02:数据读取与数据扩增

街景字符识别–Task02:数据读取与数据扩增先学习:https://github.com/datawhalechina/team-learning/blob/master/03%20%E8%AE%A1%E7%AE%97%E6%9C%BA%E8%A7%86%E8%A7%89/%E8%AE%A1%E7%AE%97%E6%9C%BA%E8%A7%86%E8%A7%89%E5%AE%9E%E8%B7%B5%EF%BC%88%E8%A1%97%E6%99%AF%E5%AD%97%E7%AC%A6%E7%BC%9

2020-05-23 16:11:45 490

原创 阿里天池竞赛-街景字符识别准备工作

这里写自定义目录标题阿里天池竞赛-街景字符识别准备工作运行环境及安装阿里天池竞赛-街景字符识别准备工作比赛链接:https://tianchi.aliyun.com/competition/entrance/531795/introduction运行环境及安装安装anaconda和python3.7 ,我笔记本上已经有python3.7和anaconda了,只需要再安装Pytorch就可以了。安装pytorch 笔记本没有GPU,是win10,所以,直接在anaconda navigator中搜

2020-05-20 21:42:36 357

原创 吴恩达机器学习笔记--逻辑回归

分类问题:是否垃圾邮件,肿瘤良性恶性......线性回归的问题:不适用于分类问题。因为线性回归一般用最小二乘来得出最优的回归曲线,而一个极端值,就能让曲线的偏离很大。逻辑回归就是在线性回归z=的基础上,再做了一步结果再0,1之间。决策边界g(z)=0.5,也就是z=0,当z>=0的时候,预测y值为1,否则为0.改变z=为高阶多项式,就可以使决策边界由直线是变成曲线。逻...

2019-04-13 13:28:42 135

原创 1002 第几天?

第几天? 给定一个日期,输出这个日期是该年的第几天。

2011-01-28 09:45:00 553

原创 1001 计算两点间的距离

计算两点间的距离 输入两点坐标(X1,Y1),(X2,Y2),计算并输出两点间的距离。

2011-01-28 09:42:00 634 1

企业建站完整源码网站模板ASP带后台

完整网站源码网站模板ASP带后台 带管理后台,经过测试,供企业建站参考!

2011-04-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除