自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)
  • 资源 (1)
  • 收藏
  • 关注

原创 排列组合问题探索

这里,主要是对经典的排列组合问题进行了总结,并归纳了解决这些问题的方法。解决这一类问题非常重要的一点是:要会灵活变通,有些新问题貌似没见过,但其实就是换了个马甲。文章目录一、优限法二、捆绑法三、插空法四、间接法五、实战一、优限法即 优先法,优先考虑对位置有要求的元素,再考虑余下的元素。【例】A、B、C、D、E五个人排队,要求A必须站在队首或队尾,问多少种排列方式?思路:先安排A,有A...

2019-09-04 21:44:50 532

原创 关于sum的坑

这里,以K-Means聚类为例,计算两个个体之间的距离话不多说,上代码:import numpy as np##load data setdef loadDataSet(fileName): DataMat = [] fr = open(fileName) for line in fr.readlines(): curline = line.stri...

2019-08-18 15:48:42 685 1

原创 unique和nunique的区别

简单明了:以kaggle的 Intermediate Machine Learning Micro-Course Home Page为例unique()统计list、series中的不同值的个数,返回的是list.nunique()可直接统计dataframe中每列的不同值的个数,也可用于series,但不能用于list.返回的是不同值的个数....

2019-08-03 20:02:18 1146

原创 智慧城市赛道之房产租金预测(一)

房产租金预测共分为6个阶段,任务概览:赛题分析→赛题分析\to赛题分析→数据清洗→数据清洗\to数据清洗→特征工程→特征工程\to特征工程→模型选择→模型选择\to模型选择→模型融合→模型融合\to模型融合→比赛整理比赛整理比赛整理这里,我们分阶段进行讨论,每次进行一个。文章目录一、比赛背景二、数据集字段说明1.租赁房源:2.小区信息:3.配套设施:3.二手房:4.新房:5.土地:6.人口:...

2019-07-24 21:21:07 458

原创 Titanic数据分析——KeyError: "None of [Int64Index([ 0, 1, 2,... dtype='int64')] are in the [columns]"

代码报错处:#---------------------------------------------------modify the parameter------------------------------------------------range_m = np.logspace(2, 6, 5, base = 2).astype(int)best_m = 0min_scor...

2019-07-20 17:03:23 25836 5

转载 Pandas透视表(pivot_table)详解

找到一篇关于透视图的介绍,感觉很有用,记录一下。转载:Pandas透视表(pivot_table)详解https://www.cnblogs.com/onemorepoint/p/8425300.html数据包下载:Excel File介绍也许大多数人都有在Excel中使用数据透视表的经历,其实Pandas也提供了一个类似的功能,名为pivot_table。虽然pivot_table非常有...

2019-07-15 10:43:20 472

原创 机器学习之Adaboost算法

文章目录一、算法原理1.算法的基本思想2.算法的流程二、实战分析一、算法原理1.算法的基本思想Adaboost是adaptive boosting的简写,是自适应的boosting算法,基本思想为:在前一个弱分类器的基础上,增加误分类样本的权重,这些误分类的样本在下一个弱分类器那里被重点关注,依次迭代进行,直到到达预定的足够小的错误率或最大的迭代次数为止。大概流程描述如下:初始化训练数据...

2019-07-07 16:35:09 248

原创 机器学习之集成学习(一)

文章目录一、个体与集成二、Boosting三、Bagging 与随机森林 Random Forest一、个体与集成二、Boosting三、Bagging 与随机森林 Random Forest

2019-07-03 22:14:17 343

原创 MySQL面试试题(五)

壬戌之秋,七月既望。眼看就要七月了,回首六月,好像离预期的目标还是太远。大规模仿真实验还在跑跑跑,参数还在调调调,糟心之余,唯一欣慰的是,总共完成了十篇博客,涵盖MySQL和机器学习。本次主要是总结MySQL中的联结和组合查询。文章目录一、联结表二、创建高级联结三、组合查询四、经典面试题一、联结表二、创建高级联结三、组合查询四、经典面试题...

2019-06-29 21:08:03 376

原创 机器学习之支持向量机SVM(一)

算起来,这个算法花的时间最多,之前在《统计学习方法》中已经演算了支持向量机的公式推导,上周结合《机器学习实战》的代码再一次加深了对这个算法的理解。争取这周把这个算法完整的总结出来。文章目录一、线性可分支持向量机二、线性支持向量机三、非线性支持向量机四、支持向量机的实现—SMO算法一、线性可分支持向量机二、线性支持向量机三、非线性支持向量机四、支持向量机的实现—SMO算法...

2019-06-28 15:59:37 337

原创 机器学习之支持向量机SVM(二)

第二次总结支持向量机,主要涉及到实现SVM的算法—SMO算法,分为简易版和完整版。打卡,7月1号之前完成~文章目录一.SMO算法的最优化问题分析二.两个变量的选择问题三.简易版的SMO算法四.完整版的Platt SMO算法一.SMO算法的最优化问题分析二.两个变量的选择问题三.简易版的SMO算法四.完整版的Platt SMO算法...

2019-06-25 20:53:30 282

原创 Python中的copy()和deepcopy()

最近在学习支持向量机的时候,看到了浅拷贝(copy)语句,不是很理解,于是就把相关的知识点做了一下总结。文章目录一、直接复制二、浅拷贝(copy)三、深拷贝(deepcopy)一、直接复制二、浅拷贝(copy)三、深拷贝(deepcopy)...

2019-06-25 16:28:47 271

原创 MySQL面试试题(四)

MySQL知识点整理已经进行到第四期了,间隔一段时间再看以前的题目,蓦然发现有些操作莫名其妙,可能是对表的操作还是没有透彻的理解。暑假可能要去实习了,做的就是SQL,希望归来是王者~文章目录一、分组数据二、使用子查询三、联结表四、经典面试题一、分组数据二、使用子查询三、联结表四、经典面试题问题描述:本题中用到下面三个关系:CARD 借书卡:CNO 卡号,NAME 姓名,CLASS ...

2019-06-22 13:15:28 654

原创 MySQL面试试题(三)

MySQL实战进行到第三次了,深感不易,因为还有机器学习算法要整理,最重要的是,论文的大规模仿真实验的算法还在不停的改改改,跑出来的效果就像喝了二两小酒一样,实在是无力啊,哈哈哈,感觉就像是写日记的感觉~ 加油,阳光总在风雨后吧文章目录一、使用数据处理函数二、汇总数据三、经典面试题31-50一、使用数据处理函数二、汇总数据三、经典面试题31-50...

2019-06-17 21:34:02 176

原创 机器学习之Logistic回归

冒着被老板骂的风险,没有继续调试论文上的代码,学习了一个新的算法Logistic回归。之前已经在李航老师的《统计学习》上过了一遍原理,这次是具体的代码实现。目录一、Logistic回归原理二、梯度上升算法和改机的随机梯度上升算法1.梯度上升法2.二项Logistic回归模型参数估计三、实战分析一、Logistic回归原理二、梯度上升算法和改机的随机梯度上升算法由Logistic原理可知,我...

2019-06-12 15:40:51 170

原创 MySQL面试试题(二)

MySQL面试试题(二)第二次总结MySQL相关知识点及实际操作,做起题来感觉比上次有进步。后续将继续更新,力求达到进一步熟练掌握。这一次就跳过正则表达式了,下次专门作为一节。目录:使用通配符与创建计算字段经典面试题16-30一、使用通配符与创建计算字段1.通配符前面的所有的操作符都是针对已知值进行过滤的,不管是匹配一个值还是多个值,测试值是大于还是小于已知值,或者检查某个范...

2019-06-10 00:42:19 318

原创 机器学习之朴素贝叶斯算法

机器学习之朴素贝叶斯算法这是更新的第三篇机器学习算法,进度着实有点缓慢。立个flag:每周更新一个算法,加上SQL实战一篇,每周两篇文章。目录:朴素贝叶斯原理算法代码实现及解读一、朴素贝叶斯原理朴素贝叶斯算法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集,首先基于特征条件独立假设学习输入/输出的联合概率分布;然后基于次模型,对给定的x,利用贝叶斯定理求出后验...

2019-06-08 21:05:58 555

原创 MySQL面试试题(一)

开始整理数据库的相关知识,分为4-5个系列。每一次总结流程如下:首先总结一个MySQL常用的数据操作方式,接着是对经典的面试试题进行实际操作。注:前面的总结不是全部的知识点,分为4-5个章节进行总结。MySQL面试试题(一)过滤数据与数据过滤经典面试题1-15一、过滤数据与数据过滤1. 过滤数据:主要是使用SELECT语句的WHERE子句指定搜索条件检查单个值:SELECT ...

2019-06-02 17:54:44 241

原创 机器学习之决策树(一)

机器学习之决策树(一)本篇博客整理了李航的《统计学习方法》第五章,其中关于决策树的知识,涉及决策树的构建原理,决策树的生成只用了ID3算法,后续会把C4.5算法和CART算法也整理出来。最后结合《机器学习实战》进行算法的实现。决策树原理决策树生成算法之ID3算法决策树原理在进行原理阐述之前,我们要搞清楚一个问题:为什么会有决策树的方法? 我们之前用过的K-近邻算法原理简单,实现方...

2019-05-21 17:13:31 189

转载 Python绘图之Matplotlib

Python绘图之Matplotlib转载微信公众号,链接:https://mp.weixin.qq.com/s/b8IAf-liXvgn50-3HwT1VAMatplotlib是Pyhton中最基本的可视化工具,官网地址:https://matplotlib.org/认识绘图绘图的基本操作常见图形的绘制1、认识绘图绘图之前,要调用其库import matplotlib...

2019-05-13 14:16:42 1507

原创 机器学习之K-近邻算法

之前一直在手推李航的《统计学习方法》,掌握机器学习所用到的统计学方法。这里,结合《机器学习实战》把机器学习所涉及到的算法用Python实现机器学习之K-近邻算法什么是机器学习K-近邻算法原理K-近邻算法代码解读什么是机器学习举个栗子:比如一个女孩要找对象,而媒婆手里有很多年轻的小伙子,那如何给女孩推荐心仪的男孩子呢?根据当今社会正常的审美观,提取以下三个特征:身高:高或矮,颜值...

2019-05-11 21:27:23 213

原创 MySQL基础知识四——表连接

目录SQL项目SQL表连接第一部分 SQL项目项目五:组合两张表,在数据库中创建表1和表2,并各插入三行数据。要求:编写一个SQL查询,满足条件:无论person是否有地址信息,都要基于上述两表提供person的以下信息:FirstName,LastName,City,State解题过程:USE test1;CREATE TABLE Person_1 ( Perso...

2019-03-02 22:05:14 181

原创 MySQL基础知识三

目录 - SQL项目 - 基础知识<三>第一部分 SQL项目项目三:超过5名学生的课,创建如下所示的图表,有students学生和class课程。编写一个SQL查询,列出所有超过或等于5名学生的课。做题过程如图:项目四:交换工资,创建一个salary表,如下所示,有m=男性和f=女性的值。例如:做题过程:第二部分 基础知识<三>1、MySQ...

2019-03-01 22:17:21 127

原创 MySQL基础知识一及软件安装

目录 - MySQL软件安装 - 数据库基础知识<一>第一部分 MySQL软件安装这一部分内容不是讲具体的MySQL软件的安装方法,而把焦点放在了安装过程中遇到的困难,踩到了的坑(PS:我按了一下午,基本上所有的坑都被我踩到了,这运气。。。)问题一:关于.ini文件的问题如下图一所示,是已经成功了的文件形式,我们可以看到有两个.ini文件,当初压缩包解码之后,一个都没...

2019-02-26 22:00:49 119

转载 管理科学与运筹学(MS/OR)国际期刊最新权威排名

本文为转载文章,感谢博主的分享,觉得非常有用。转载地址:http://blog.sciencenet.cn/blog-264246-613914.html首先声明:这份MS/OR国际期刊排名是完全根据2011年JCR(Journal Citation Reports)的Article Influence Score(AIS)而给出的。所以,这份榜单仅仅是转载JCR的MS/OR ranking而...

2019-01-25 13:08:23 2761

转载 第五次任务之三大抽样分布

转载处:https://www.cnblogs.com/Belter/p/8280492.html目录分位点/分位数(Fractile)卡方分布(χ2\chi ^{2}χ2)t分布F分布三大抽样分布之间的联系抽样分布就是统计量的分布,统计量包括均值、方差、比例,分布包括正态分布(样本容量n>30)、t分布(样本容量n<30)、卡方分布、F分布。下面从分位数、定义、...

2019-01-13 16:41:16 4021

原创 第四次任务

多元线性回归线性回归是很多机器学习机器学习算法的基础,所谓基础决定上层建筑,学好线性回归及其各种优化技巧,能为以后学习聚类乃至神经网络奠定坚实基础。数据类型探讨单变量数据:考虑的是一个变量的频数或频率,描述的对象只有一个。二变量数据:对于每一个观察结果,二变量数据给出两个变量的数值—而不是一个。如果其中一个变量以某种方式受到控制,或者被用来解释另外一个变量,则这个变量被称为自变量或解释变...

2019-01-08 22:27:46 121

原创 第三次任务

假设检验(Hypothesis Testing)前沿:他人的言论未必句句真实,问题是如何判断他人的言论何时是真,何时是假?假设检验为你提供了一种方法——利用样本检验各种统计断言是否可能属实。通过假设检验可以权衡证据,检验极限结果——是否是巧合还是存在其他内在的根据?什么是假设检验假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体...

2019-01-07 21:59:51 196 1

原创 第二次任务

## 目录### 中心极限定理### 置信区间

2019-01-05 21:20:21 223

原创 第一次任务

目录 - 统计学基本知识梳理 - 离散变量的概率分布 - 大数定律 - 正态分布

2019-01-03 20:34:52 467

多目标进化算法评价

多目标算法性能评价,基本上包括了所有的评价方法,有MATLAB和C++两个版本。

2018-12-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除