自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 中文导入R 解决乱码和格式问题

在将从网页上爬取下来的中文,导入R中产生一系列问题,包括格式问题和乱码问题,在网上找了好多方法,转换了各种编码格式,不管用==解现在总算解决了,又怕自己以后忘掉,就想把它记下,以后再碰到的时候就不会有问题了。在含有中文文本的csv文件导入R中有可能碰到三个问题:1. 无法导入2. 格式问题,一列数据导入后变成多列:源数据如下所示:导入后,数据变成多列数据,3. 乱码问题, 如上图所示,...

2019-01-18 18:03:39 6506

原创 R语言租房市场分析(聚类、回归)

建立模型kmeans聚类导入数据house <- read.csv("house.csv",stringAsFactor = T)View(house)df<-data.frame

2018-12-29 20:40:25 2144 1

原创 链家租房市场分析(R爬虫、数据可视化)

文章目录前言目的数据爬取数据整理建立模型房源Kmeans聚类房价影响因素分析线性回归模型结论分析前言对于即将毕业面临就业的大学生,尤其是离开家乡在大城市漂泊的人来说,租房尤其是一件大事。在选择一个合适的房子居住之前,我们可以对租房市场进行分析。本文以链家上海租房信息为例,进行分析。目的数据爬取数据整理建立模型房源Kmeans聚类房价影响因素分析线性回归模型结论分析...

2018-12-29 14:47:12 7016 1

原创 【SQL必知必会】笔记 创建表

创建一张新表CREATE TABLECREAIE TABLE customers(cust id int NOT NULL,cust_name char(50) NOT NULL ,cust address char(50) NULL,custcity char(50) NULL,cust_state char(5) NULL,cust_zip char(10) NULL,cus...

2018-11-17 12:53:04 214

原创 【SQL必知必会】数据插入更新和

数据的插入insert into values数据的插入有以下几种方式:插入完整的行;插入行的一部分;插入多行;插入某些查询的结果。插入完整的行:INSERT INTO Customers VALUES ('Pep E. LaPew','100 Main Street','Los Angeles','CA','90046','USA',NULL,NULL);这种方法的缺陷...

2018-11-17 11:47:50 355

原创 【SQL必知必会】笔记 UNION

1

2018-11-16 20:10:43 154

原创 【SQL必知必会】 笔记 子查询 IN

子查询IN查询(query) :任何SQL语句都是查询。但此术语一般指SELECT语句。子查询( subquery):即嵌套在其他查询中的查询,也可以说,嵌套在其他select语句中的select语句。举个例子,我们想知道购买TNT2产品的客户的id,但是产品id和客户id不在同一张表上,两张表的订单号码这一列是相同的。我们需要分别进行两次查询。首先我们需要从orderitems这张表中...

2018-11-12 15:55:17 304

原创 【SQL必知必会】 笔记 分组汇总

数据的分组(group by/having)GROUP BY(COLUMN)根据某一列的类别进行分组根据某一列的类别进行分组。举个例子:比如说我们需要知道每一个id下分别有多少个产品,因此我们需要根据id进行对数据进行分组,同时对每个组进行计数。SELECT vend_id, COUNT (*) AS num_prods FROM products GROUP BY vend_id;...

2018-11-12 15:17:53 279

原创 【SQL必知必会】笔记 基础函数

与其他大多数计算机语言一样, SQL支持利用函数来处理数据。函数一般是在数据上执行的,它给数据的转换和处理提供了方便。可移植性:能运行在多个系统上的代码。相对来说,多数SQL语句是可移植的,不同的DBMS之间实现使用函数有较大的差异,也就是说函数的可移植性却不强。几乎每种主要的DBMS的实现都支持其他实现不支持的函数。使用函数时,要做好代码注释,以便以后你(或其他人)能确切地知道所编写SQ...

2018-11-12 10:22:28 200

原创 【SQL必知必会】笔记 多列拼接成一列

拼接字段(多列拼接成一列)拼接(concatenate): 将值联结到一起构成单个值。多数DBMS使用+或||来实现拼接,MySQL则使用Concat()函数来实现拼接两个列。假设vendors表中包含供应商名和所在国家的信息。假如要生成一个供应商报表,需要在供应商的名字中按照name(country)这样的格式列出供应商的位置。此报表需要单个值,而表中数据存储在两个列vend_nam...

2018-11-11 14:07:14 5301

原创 【SQL必知必会】笔记 SQL通配符

通配符:WHERE子句中用于筛选用来匹配值的一部分的特殊字符通配符只能用于文本字段(字符串),不能用于非文本数据类型的数据使用通配符时,必须使用LIKE操作符1. 百分号(%)通配符%表示任何字符出现任意次数比方说,想要表中找名字以jet开头的产品的产品id和产品名称,用’jet%'表示SELECT prod_id, prod_name FROM products WHER...

2018-11-11 10:58:46 485

原创 【SQL必知必会】笔记 过滤条件

过滤数据:WHERE子句根据where子句中指定的搜索条件进行过滤筛选价格为2.5元的产品的产品名称和产品价格SELECT prod_name, prod_price FROM products WHERE prod price=2.50;除了等于之外,where还有一系列操作符,如下图所示。SELECT vend_id, prod_name FROM products W...

2018-11-11 09:37:48 523

原创 【SQL必知必会】笔记 数据检索与排序

SQL语句格式要求:多条SQL语句必须以分号(;)分隔SQL语句不区分大小写,因此SELECT与select是相同的。很多人习惯对所有SQL关键字使用大写,而对所有列和表名使用小写,这样做使代码更易于阅读和调试标识符(如数据库名、表名、列名)有可能要求区分大小写SQL语句中所有空格可以被忽略使用注释的方法包括行内注释(–)和多行注释(/* */)使用 . 来限定某个特定...

2018-11-10 20:33:01 216

原创 【SQL必知必会】笔记 数据库基础

数据库(database):保存有组织的数据的容器(通常是一个文件或一组文件)数据库管理系统(DBMS): 数据库软件表(table):一种结构化的文件,可用来存储某种特定类型的数据。 同一数据库的不同标的表名不能重复。列(column): 表中的一个字段。行(row): 表中的一个记录。主键(primary key):一列(或一组列),其值能够唯一区分表中每个行。 通常为编号/ID...

2018-11-10 19:28:29 157

原创 用R语言实现决策树分类

关于决策树模型的相关理论,可参照周志华的《机器学习》一书第四章节,此处省略。用R语言实现决策树模型,我们使用自带的数据集鸢尾花iris,以及用的R包有rpart和rpart.plot。rpart是一个专门用于做决策树模型的包,rpart.plot则用于绘制rpart模型。为了方便理解和记忆,此处将模型的完整建立分成导入数据包/设置建模参数/数据切分/建模/调整模型参数并计算训练误差和测试误差...

2018-10-27 23:06:58 9623 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除