自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 机器学习kaggle案例:沃尔玛招聘 - 商店销售预测

kaggle链接:https://www.kaggle.com/c/walmart-recruiting-store-sales-forecastingipynb文件:https://github.com/824024445/KaggleCases一、简介1.1 比赛描述建模零售数据的一个挑战是需要根据有限的历史做出决策。如果圣诞节一年一次,那么有机会看到战略决策如何影响到底线。在此招聘...

2019-08-21 22:56:23 6164 4

原创 机器学习kaggle案例:风控评分卡模型(Give_Me_Some_Credit)

kaggle链接:https://www.kaggle.com/c/GiveMeSomeCreditipynb文件:https://github.com/824024445/KaggleCases/blob/master/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0kaggle%E6%A1%88%E4%BE%8B%EF%BC%9A%E9%A3%8E%E6%8E%A7%...

2019-08-21 02:02:31 9043 1

原创 机器学习经典Kaggle案例:泰坦尼克号:从灾难中学习机器

kaggle链接:https://www.kaggle.com/c/titanic一、简介泰坦尼克号案例可以说是kaggle的“hello world”,入门者的必看案例。1.1 比赛描述RMS泰坦尼克号沉没是历史上最臭名昭着的沉船之一。1912年4月15日,在她的处女航中,泰坦尼克号在与冰山相撞后沉没,在2224名乘客和机组人员中造成1502人死亡。这场耸人听闻的悲剧震惊了国际社会,并为...

2019-08-18 17:48:13 17898 7

原创 学习曲线函数

from sklearn.svm import LinearSVC from sklearn.learning_curve import learning_curve #绘制学习曲线,以确定模型的状况 def plot_learning_curve(estimator, title, X, y, ylim=None, cv=None, ...

2019-08-15 16:35:35 436

原创 机器学习:8降维

ipynb文件见:https://github.com/824024445/Machine-learning-notes/blob/master/8降维.ipynb《Sklearn与TensorFlow机器学习实用指南》学习笔记维数灾难:很多机器学习的问题都会涉及到有着几千甚至数百万维的特征的训练实例,这不仅让训练过程变得非常缓慢,同时还很难找到一个很好的解。幸运的是,在现实生活中我们...

2019-08-14 16:37:53 401

原创 机器学习:7集成学习和随机森林

ipynb文件见:https://github.com/824024445/Machine-learning-notes/blob/master/7集成学习和随机森林.ipynb《Sklearn与TensorFlow机器学习实用指南》学习笔记一、集成学习集成学习就是合并多个分类器的预测。一般会在一个项目快结束的时候使用集成算法,一旦建立了一些好的分类器,就可以使用集成把它们合并成一个更...

2019-08-13 16:53:06 654

原创 数据分析学习路径及部分资源分享

说明:本文所含资源大多为mobi格式书籍,电脑端可以下载电脑端kindle读取(点此下载安装),手机端可以在应用商店下载多看阅读打开本文所列所有书籍百度网盘链接:ps:整理不易,点个赞吧1.数据分析工具学习python除了学会基础知识外,在数据分析中主要学习numpy、pandas、matplotlib这三个包。学sql主要是用来从数据库中进行提取数据。python:《p...

2019-08-09 16:51:00 1069 2

原创 机器学习:6决策树

ipynb文件见:https://github.com/824024445/Machine-learning-notes/blob/master/6决策树.ipynb《Sklearn与TensorFlow机器学习实用指南》学习笔记决策树和支持向量机一样, 决策树是一种多功能机器学习算法, 即可以执行分类任务也可以执行回归任务。决策树也是随机森林的基本组成部分,而随机森林是当今最强大的机...

2019-08-09 16:03:17 364

原创 python数据分析工具3:matplotlib

3.1 Matplotlib简介及图表窗口Matplotlib → 一个python版的matlab绘图接口,以2D为主,支持python、numpy、pandas基本数据结构,运营高效且有较丰富的图表库import numpy as npimport pandas as pdimport matplotlib.pyplot as plt# 图表窗口1 → plt.show()p...

2019-08-08 22:17:56 1620 1

原创 机器学习:5支持向量机

ipynb文件见:https://github.com/824024445/Machine-learning-notes/blob/master/5支持向量机.ipynb笔记来源:《Sklearn与TensorFlow机器学习实用指南》也叫最大间隔分类一、线性支持向量机分类以鸢尾花数据为例硬间隔,软间隔:软间隔就是允许一部分数据在边界内参数解释:C:值越小间隔越“软”loss...

2019-08-08 21:54:59 519

原创 python数据分析工具1:numpy

1.1 Numpy基础数据结构NumPy数组是一个多维数组对象,称为ndarray。其由两部分组成:① 实际的数据② 描述这些数据的元数据# 多维数组ndarrayimport numpy as npar = np.array([1,2,3,4,5,6,7])print(ar) # 输出数组,注意数组的格式:中括号,元素之间没有逗号(和列表区分)print(...

2019-08-08 21:49:53 218

原创 一个完整的机器学习项目

ipynb文件见:https://github.com/824024445/Machine-learning-notes/blob/master/一个完整的机器学习项目.ipynb笔记来源:《Sklearn与TensorFlow机器学习实用指南》一、下载数据import osimport tarfile # 用于压缩和解压文件import urllibDOWNLOAD_ROOT...

2019-08-08 00:47:09 1680

原创 机器学习:4训练模型(线性模型)

ipynb文件见:4训练模型.ipynb笔记来源:《Sklearn与TensorFlow机器学习实用指南》本章内容> 第一步将以一个简单的线性回归模型为例,讨论两种不同的训练方法来得到模型的最优解1.直接在封闭方程上求根2.迭代,梯度下降(GD)的方法> 第二步研究更复杂的模型:多项式回归,可以拟合非线性数据集。由于参数多,多以容易出现过拟合,所以本章还会介绍如...

2019-08-08 00:31:35 1635

原创 决策树实例及原理

一、实例import pandas as pdfrom sklearn.tree import DecisionTreeClassifier #决策树分类器。from sklearn.feature_extraction import DictVectorizer # 将特征值映射列表转换为向量from sklearn.model_selection import train_test_s...

2019-07-22 23:05:43 381

转载 python命名规则以及代码规范

Google Python命名规范module_name, 模块package_name, 包ClassName, 类method_name, 方法ExceptionName, 异常function_name, 函数GLOBAL_VAR_NAME, 全局变量instance_var_name, 实例function_parameter_name, 参数loc...

2019-07-22 18:59:04 261

原创 pycharm快捷键备忘录

常用万能命令行:ctrl+shift+A给类补全基础方法:alt+insert完成当前行的代码:ctrl+shift+enter复制粘贴一行:ctrl+d格式化代码:ctrl+alt+L选中代码移动:alt+shift+上下键ctrl+shift+上下键:可以移动当前方法体,如果移动一行代码只能在代码体内移动代码大小写:ctrl+shift+U运行:shift+F10查看...

2019-07-03 20:32:46 212

原创 Markdown中公式编辑

有道云笔记官方教程:http://note.youdao.com/iyoudao/?p=2411其它更详尽教程:http://liyangbit.com/math/jupyter-latex/

2019-06-25 15:04:00 114

原创 Django-博客搭建-1.创建

1. 简要介绍 Django是一个开放源代码的Web应用框架,由Python写成。采用了MVC的框架模式,即模型M,视图V和控制器C。这是百度百科的解释。其实不用太在乎MTV还是MVC,这样看起来感觉好像很难懂的样子,其实根本就是同一种东西,三个字母代表的可以说仅仅是文件夹的分组而已。 原理: 1. 用户在浏览器中输入url 2. 浏览器判断协议,将域名转换成ip地址,到...

2018-09-09 19:59:53 587

原创 web工程师的自我修养

杂货 hack:不优雅的解决方案 软件工程师事业指南:技术、成长、声望 sublime编辑器比用dreamweaver更有优势–这两个是编辑器,是文件级别的,即打开某个语言文件执行,而pycharm这种是IDE(集成开发环境)是项目级别的,是一站式的服务,缺点是比较重量级 前端工程师重要的技能有:关于网络性能和HTTP协议 作品集:github,dribbble(设计师的...

2018-09-09 16:09:48 384

原创 anaconda入门指南及pycharm虚拟环境问题

一、anaconda简书上的一篇文章,感觉写的很不错。见https://www.jianshu.com/p/eaee1fadc1e9笔记:其实anaconda就是python版本管理器,可以用来创建很多个虚拟环境,能够很好地导入导出各个环境的包。另外它还安装好了很多分析的包,numpy和pandas等二、pycharm虚拟环境就python版本管理的问题来说,其实不用...

2018-09-02 20:26:55 298

原创 python操作excel----新增数据

目的:想要为某个表新增数据,但是xlrd只能读方法:概要:通过xlrd读取表格,然后通过xlutils复制,而后保存地址为源文件,即完成新增。代码:import xlrdfrom xlutils.copy import copy# 读取源sql表data_table = xlrd.open_workbook('files\last_result.xls', for...

2018-08-29 20:52:23 918

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除