数据分析
打不死的小黑
个人github地址:https://github.com/wakemeuphzk/study,关于AI的学习记录,与各位共勉! 喜爱文艺的程序员,喜欢技术研究、毛姆、陈奕迅、张国荣、文学创作、火影及绘画的记得关注微信公众号:残留的存在主义。
展开
-
机器学习(五):Pandas的使用技巧(一)
这是一篇机器学习的介绍,本文不会涉及公式推导,主要是一些算法思想的随笔记录。适用人群:机器学习初学者,转AI的开发人员。编程语言:Pythonpandas常用函数清单轻松处理浮点数据中的丢失数据(以NaN表示)以及非浮点数据大小可变性:可以从DataFrame和更高维的对象插入和删除列自动和显式的数据对齐:对象可以显式地与一组标签对齐,或者用户可以简单的忽略标签,让Series,Da...原创 2019-04-03 23:48:00 · 357 阅读 · 0 评论 -
机器学习(六):Pandas的使用技巧(二)
这是一篇机器学习的介绍,本文不会涉及公式推导,主要是一些算法思想的随笔记录。适用人群:机器学习初学者,转AI的开发人员。编程语言:Python自己在项目中经常用到pandas,尤其是数据分析与数据预处理这两部分,自己最直接的感受就是pandas像是SQL+excel,当然,pandas的功能远不止这些。(注:以下pd均表示pandas,df指pandas对象)数据切片pandas获取某...原创 2019-04-05 15:15:37 · 291 阅读 · 0 评论 -
机器学习(四):Python与Numpy的使用技巧
这是一篇机器学习的介绍,本文不会涉及公式推导,主要是一些算法思想的随笔记录。适用人群:机器学习初学者,转AI的开发人员。编程语言:Python下面从自己项目中遇到的一些python、numpy知识点整理出来:(注:以下np均表示numpy)python2与python3的几点不同python2与python3是目前使用最广泛的两个版本,一些新的代码都建议使用python3,对于一些经典...原创 2019-04-05 14:08:29 · 411 阅读 · 0 评论 -
机器学习(七):Pandas的使用技巧(三)
这是一篇机器学习的介绍,本文不会涉及公式推导,主要是一些算法思想的随笔记录。适用人群:机器学习初学者,转AI的开发人员。编程语言:Python自己在项目中经常用到pandas,尤其是数据分析与数据预处理这两部分,自己最直接的感受就是pandas像是SQL+excel,当然,pandas的功能远不止这些。(注:以下pd均表示pandas,df指pandas对象)映射MapDataFram...原创 2019-04-06 21:32:08 · 317 阅读 · 0 评论 -
机器学习(八):样本分布不均衡问题的处理
这是一篇机器学习的介绍,本文不会涉及公式推导,主要是一些算法思想的随笔记录。适用人群:机器学习初学者,转AI的开发人员。编程语言:Python自己在项目中拿到数据,大部分情况下都是自己切分训练集、测试集,对于训练集,经常会遇到正负样本比例很不均衡的情况,即偏斜类(Skewed Class)问题,有些时候往往还很严重,比如数据量上负样本:正样本>=100,这是比较严重的偏斜类问题,下面针...原创 2019-04-13 12:17:19 · 6502 阅读 · 0 评论