自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

明顯有閒

要獲得相當地位,就得獲得相當財產。

  • 博客(14)
  • 资源 (1)
  • 收藏
  • 关注

原创 Regular Expressions

正则表达式练习:RegexOne

2018-05-14 11:54:42 167

原创 Pandas 中的 string 方法

Pandas 中的 string 方法 官网最详细的 string 操作: string handling

2018-05-13 20:53:02 2031

原创 用编程方法进行 数据清理

用编程方法进行 数据清理 Programmatic Data Cleaning: 1. Define 2. Code 3. Test步骤一: 定义(Dfine)确定处理问题的方案,并以文字形式记录下来。步骤二:代码(Code)然后,将这些文字转化为代码。步骤三:测试(Test)最后,检验数据,看代码是否奏效。...

2018-05-11 16:11:18 1243

原创 Python: Control Flow

Python: Control Flowconditional statementsfor and while loopsbreak and continueuseful built-in functionslist comprehensions

2018-05-11 08:58:46 595

原创 Python: Naming Variables

Python: Variables一undersore,number,normal letter二can not use reserved words三pythonic way naming convention: snake case

2018-05-10 07:43:03 267

原创 Python: Assignment Operators

Python: Assignment Operators一x = 7y = xprint(y) # output: 7二Assign multiple variables at once:x, y, z = 7, 8, 9 Can use this when assigning closely related variables, like the width an...

2018-05-09 21:39:16 512

原创 Python: Arithmetic Operator

Python: Arithmetic Operator+, addition-, subtraction*, multiplication/, division**, exponentiation%, modulo (return the remainder)//, integer division (it rounds down the answer down to an in...

2018-05-09 18:09:45 442

原创 Python: built-in functions

Python: built-in functionsprint(): built-in function that displays input value as text in the output.print(3+5)8

2018-05-09 17:44:35 258

原创 python 总结

python 总结一. Data Types and Operators二. Control Flowconditional statements loops built-in functions list comprehensions三. Functionsfunction definitions variable scope documentation lamb...

2018-05-09 17:15:58 314

原创 数据整洁度问题

数据的整洁度问题数据可能存在两类问题:质量问题,整洁度问题,这里讨论一下后者。该问题为什么重要数据分析的整个过程中,可能80%的时间都用于清理和准备数据。其中,为了使分析工作更为顺利,我们需要使数据变得整洁。 何为整洁数据...

2018-05-08 19:58:14 1235 2

原创 The Difference Between Assessing and Exploring Data

数据评估 和 数据探索 的不同数据评估(data assessment)属于数据整理的一部分;数据探索(data exploration)属于探索性数据分析(EDA)的一部分。数据整理(data wrangling)重在收集正确的数据,评估数据的质量和结构,然后清理数据;但是这些并不会改进分析、也不会改善可视化及模型。探索性数据分析(EDA) 重在探索数据并增强数据,以最大限度的发...

2018-05-06 22:45:32 155

原创 糖尿病临床试验 数据分析

糖尿病临床试验 数据分析糖尿病临床试验 数据分析项目背景胰岛素工作原理临床试验及其指标医疗数据 常见问题及原因数据评估目测评估编程评估后记注脚项目背景糖尿病(尤其是2型糖尿病)算得上是21世纪最大的流行病,在我国更是情况堪忧[^footnote]。20世纪20年代之前,人们闻“糖”色变,因为无法治疗,患病就相当于慢性死亡。这种病会让血糖升高...

2018-05-06 15:51:00 4475 3

原创 数据评估

Data Assessment: Types and Steps评估数据的两种方式:目测方式评估(Visually Assessment),编程方式评估(Programmatic Assessment)。Type 1: Visually Assessment目测方式评估:用 pandas 或电子应用表格打开并查看所有数据。Type 2: Programmatic Asses...

2018-05-04 22:21:30 1173

原创 Unclean Data: Low Quality vs. Untidy

Dirty Data vs. Messy Data有两类不干净的数据:脏数据(Dirty Data)和杂乱数据(Messy Data)。打个比方,在一个脏乱的房间里,脏数据(Dirty Data)就像房间内的垃圾、灰尘、香蕉皮等,杂乱数据(Messy Data)就像房间里胡乱放置的东西、衣服、书等。Dirty Data脏数据(Dirty Data)通常对应于内容问题(conte...

2018-05-03 17:36:28 727

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除