自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 【Python】爬虫+动态Cookie获取

一、前言背景是帮助朋友爬取一个国家网站发布的肺炎疫情统计信息。二、遇到的问题朋友本来是打算按照最基本的方法进行爬取,代码如下:import requestsimport reURL = "xxxxxx"r = requests.get(URL)#print(r)但这样收到服务器的回复是HTTP 412,没有获得正常的回应。这就非常奇怪了,请求的页面看起来也是静态页面...

2020-02-09 20:58:54 12054 1

原创 leetcode-29

1.我的想法题目考查自行实现除法,理所当然想到用减法代替。由于int类型的范围是-2的31次方到2的31次方减一,最小的数除以-1要变成最大的数。结果的符号就由两个数同号还是异号决定。2.结果单纯的减法速度太慢,之后改用两倍除数与被除数比较加快运行速度,那么变量类型得是long。(之所以是两倍而不是三倍、四倍,是因为被除数每次都要被减去一部分再和除数相比较保证被除数大于除数...

2019-07-05 21:23:24 237

原创 成人数据集报告(kNN、决策树、朴素贝叶斯)

1.问题描述根据人口普查数据预测某个人收入是否超过5万美元/年,借此可以用来进行一些产品的推广。2.数据准备与处理数据集包含14个属性,分别是:年龄、工作类别、final weight、教育、教育数量、婚姻状况、职业、关系、种族、性别、资本收益、资本损失、每周小时数、国籍。其中,年龄、final weight、教育数量、资本收益、资本损失和每周小时数是数值标签,其余是标称标签。数据集的实例数量为5...

2018-07-09 17:59:49 11871 8

原创 kaggle——泰坦尼克数据集

1.问题描述RMS泰坦尼克号的沉没是历史上最臭名昭着的沉船之一。1912年4月15日,在首次航行期间,泰坦尼克号撞上冰山后沉没,2224名乘客和机组人员中有1502人遇难。这场轰动的悲剧震撼了国际社会,并导致了更好的船舶安全条例。海难导致生命损失的原因之一是没有足够的救生艇给乘客和机组人员。虽然幸存下来的运气有一些因素,但一些人比其他人更有可能生存,比如妇女,儿童和上层阶级。在这个挑战中,我们要求...

2018-06-26 23:16:47 27236 2

原创 PCA简化数据

1.前言之前做了不少的机器学习模型和算法,但我们用来训练模型的数据维数都是很小的,所以模型的预测结果也能差强人意。但之前做决策树的时候,曾经带入过十几维的数据得到的决策树是过拟合的,说明数据维数还是影响着模型。使数据降维的主要原因如下:a.在训练数据集中,也许并不是所有的数据都能对预测或者是分类起作用,我们只需要找到其中起绝对性因素的数据特征即可。b.训练数据的维数过多会导致模型的训练时间延长2....

2018-06-19 16:58:55 260 1

原创 k-Means算法和实战演练

1.  k-均值聚类算法介绍跟之前写的SVM和Adaboost算法不一样的是,k-均值聚类算法所进行分类的数据是没有类别的。之前写的机器学习算法,都是分类算法,属于监督学习,简单来说就是我给训练机器一部分带有分类标签的训练数据,训练机器自己通过学习找到其中的分类准则,并用该准则来分类之后给的预测数据;k-均值聚类算法是聚类算法,属于无监督学习,简单来说就是我给训练机器的数据就是没有分类标签的,训练...

2018-06-03 16:50:41 1422

原创 AdaBoost算法及其应用

1.集成方法集成方法是将不同的分类器组合在一起将测试数据集进行分类的方法,可以是不同算法的集成或是同一算法在不同设置下的集成,也可以将数据集不同部分分配给不同分类器的集成。集成方法主要包括bagging和boosting两种方法,而AdaBoost算法是基于boosting思想的机器学习算法。2.boosting介绍boosting所使用的多个分类器类型都是一致的,根据被已有1分类器错分的那些数据...

2018-05-25 20:16:31 4557 1

原创 SVM数学原理及代码实现

1.1二维空间简单示例SVM(支持向量机)的典型应用是分类问题,先举一个简单的例子:在上述二维空间当中,我们将正方形是分到A类还是B类呢?SVM就是给了我们一个将正方形分到A类或是B类的方法。在二维空间里,SVM的方法是在A类和B类中间画一条直线g(x)=0,直线上方的点属于B类,而直线下方的点属于A类:在二维空间中,g(x)的表达式很容易想到:g(x)=ax+by+c。1.2 高维空间上述的情景...

2018-05-19 21:22:51 2723 10

原创 C语言实现循环队列

#include "stdafx.h"#include <stdlib.h>#define m 5typedef int datatype;typedef struct Queue{    datatype sequ[m]; int rear,front; int quelen;}QUEUE,*PQUEUE;PQUEUE Create_queue(){    PQUEUE p; p=(...

2018-05-11 21:34:24 300

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除