- 博客(4)
- 收藏
- 关注
原创 kaggle(02)-房价预测案例(基础版)
# 房价预测案例## Step 1: 检视源数据集import numpy as npimport pandas as pd#### 读入数据* 一般来说源数据的index那一栏没什么用,我们可以用来作为我们pandas dataframe的index。这样之后要是检索起来也省事儿。* 有人的地方就有鄙视链。跟知乎一样。Kaggle的也...
2018-03-27 09:06:22 1731 4
原创 如何使用cookie信息,完成自动登录
在做爬虫任务的时候,我们常常会遇到很多网页必须登录后,才可以开放某些页面。所以登录是爬取网页的第一步。但是,通过post表单(包含用户名和密码)的方法,对于那些不需要输入比较复杂的验证码的网页,可以使用正则表达式将验证码和验证码的ID匹配得出,然后实现自动化登录。但是,现在多部分的网页都是需要输入图片验证码的,所以必须得通过人工的识别图片然后输入验证码。当然,你也可以开发一个深度学习算法,将下载下...
2018-03-18 17:12:59 87343 3
原创 周志华《Machine Learning》 学习笔记系列(1)--绪论
机器学习致力于研究如何通过计算手段,利用经验来改善系统本身的性能,在计算机系统中,“经验”通常是以“数据”形式存在的,所以,机器学习的主要内容是关于在计算机上从数据中产生“模型”的算法,即学习算法。 从数据中学到模型的过程称为“学习”或者“训练”,这个过程通常由某个学习算法完成。 拥有了标记信息的示例,则称为“样例“。 通过经验,可以使得算法能够对很庞大的假设空间进行启发式的选择,这称为归纳...
2018-03-09 20:50:34 260
原创 设置SSH免密码自动登录(使用别名)
每次登录服务器都要写一大串的用户名(username@服务器地址)和登录密码十分的繁琐,所以本文就告诉大家如何通过修改配置文件,达到只需要输入:ssh jack(你起的别名)就可以一键登录到服务器中。1.创建公钥(相当于你自己的一个身份信息)ssh-keygen -t rsa (一定要记住文件保存的路径,后面会有用)注:我这边是因为已经生成了该文件,所以选择了no,如果没有生成过文件则输入...
2018-03-07 11:05:38 1399 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人