自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 kaggle(02)-房价预测案例(基础版)

# 房价预测案例## Step 1: 检视源数据集import numpy as npimport pandas as pd#### 读入数据* 一般来说源数据的index那一栏没什么用,我们可以用来作为我们pandas dataframe的index。这样之后要是检索起来也省事儿。* 有人的地方就有鄙视链。跟知乎一样。Kaggle的也...

2018-03-27 09:06:22 1731 4

原创 如何使用cookie信息,完成自动登录

在做爬虫任务的时候,我们常常会遇到很多网页必须登录后,才可以开放某些页面。所以登录是爬取网页的第一步。但是,通过post表单(包含用户名和密码)的方法,对于那些不需要输入比较复杂的验证码的网页,可以使用正则表达式将验证码和验证码的ID匹配得出,然后实现自动化登录。但是,现在多部分的网页都是需要输入图片验证码的,所以必须得通过人工的识别图片然后输入验证码。当然,你也可以开发一个深度学习算法,将下载下...

2018-03-18 17:12:59 87343 3

原创 周志华《Machine Learning》 学习笔记系列(1)--绪论

机器学习致力于研究如何通过计算手段,利用经验来改善系统本身的性能,在计算机系统中,“经验”通常是以“数据”形式存在的,所以,机器学习的主要内容是关于在计算机上从数据中产生“模型”的算法,即学习算法。 从数据中学到模型的过程称为“学习”或者“训练”,这个过程通常由某个学习算法完成。 拥有了标记信息的示例,则称为“样例“。 通过经验,可以使得算法能够对很庞大的假设空间进行启发式的选择,这称为归纳...

2018-03-09 20:50:34 260

原创 设置SSH免密码自动登录(使用别名)

    每次登录服务器都要写一大串的用户名(username@服务器地址)和登录密码十分的繁琐,所以本文就告诉大家如何通过修改配置文件,达到只需要输入:ssh jack(你起的别名)就可以一键登录到服务器中。1.创建公钥(相当于你自己的一个身份信息)ssh-keygen -t rsa (一定要记住文件保存的路径,后面会有用)注:我这边是因为已经生成了该文件,所以选择了no,如果没有生成过文件则输入...

2018-03-07 11:05:38 1399 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除