R
文章平均质量分 61
gaocuo111
这个作者很懒,什么都没留下…
展开
-
ANZ数据分析笔记
目录 导入数据 数据准备 改变数据格式,检查唯一性 导入数据 df = read.csv("data/DSynth_Output_100c_3m_v3.csv") 数据准备 The dataset contains 12043 transactions for 100 customers who have one bank account each. <dataframe描述> The transactional period is from 01/08/2018 - 31/10/原创 2021-03-04 22:16:50 · 320 阅读 · 1 评论 -
R的清洗工作
1. 找重复值 dataset: cd <- Customer Demographic表 size: 4,000 x 13 > distinct(cd) # A tibble: 4,000 x 13原创 2021-02-27 11:36:16 · 102 阅读 · 0 评论 -
R读取文件的准备工作
修改、查看工作路径 > getwd() #查看当前工作目录 [1] "/Users/user" > setwd('/Users/user/Rwd') #设置当前工作目录 > getwd() [1] "/Users/user/Rwd" #修改后的当前工作目录 导入不同文件类型的数据 Excel (a.存为csv文件 b.安装readxl包直接读取xsl c.读取剪切板内的数据) a.存为csv文件 read.table('tablename.csv') read.cs...原创 2021-02-26 21:12:26 · 228 阅读 · 0 评论 -
R语言基本操作
1. factor 转换Date时间日期形式: as.Date(rentD$rent2.RENT_END_DATE, format ="%d-%b-%y") 转换前:03-FEB-20 15:02 转换后:2020-02-03 %b代表英文缩写;%B英文全写;%Y四位年份; %y两位年份 2. Date可以互相加减,输出结果为天数 as.Date(rentD$rent2.RENT_END_DATE) - as.Date(rentD$rent2.RENT_START_DATE) 3. ..原创 2020-06-13 15:19:50 · 318 阅读 · 0 评论