自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 资源 (1)
  • 收藏
  • 关注

原创 数据探索性分析的基础介绍

数据探索性分析的基础介绍导读:当我们拿到数据之后,总是会因某些原因,加速对数据的使用,希望能够快速的产出成果,待回头检查发现,对数据情况的不尽了解,将有可能违背预测模型的一些重要的统计假设,比如要求变量的正态分布,方差齐性,不相关等等,做出来的模型效果也可能因此产生错误的“好”或者错误的“坏”,耗费额外的模型开发成本,导致项目风险的增加。为避免上述事情发生,需要在对数据加工之前进行探索性...

2020-02-06 17:43:46 1516

原创 不忘初心,方得始终——线性回归的python实现

hello,大家好,我是此木,很高兴能在2020年的第一天和大家分享点东西,新的一年,新的开始,希望大家能在接下来的一年里有所成长,有所收获。导读:在当前机器学习、深度学习、强化学习、元学习等盛行的时代,我想在新年第一天做一次回归始点的总结,不忘初心,方得始终。在数据分析中,回归问题,可以说是模型解决的最基础同时也是最广泛的问题,在统计学中,你建立的第一个预测模型解决的问题我相信就是回归。本文...

2020-02-06 17:38:45 445

转载 样本不平衡问题分析与部分解决办法

本文转自:https://blog.csdn.net/qq_33472765/article/details/86561557本文仅做学习笔记之用途,如有其他需求,请联系原文作者。最近工作中在处理文本分类问题遇到了分类不均衡的问题,主要还是样本太少还同时非常的不均衡正负样本1:10(类别不平衡比例超过4:1,就会造成偏移),就使用了SMOTE方法。注意:在进行数据增广的时候一定要将测试...

2019-07-01 09:22:15 5811

转载 pandas 数据类型转换

本文转自:https://www.cnblogs.com/onemorepoint/p/9404753.html仅为个人学习笔记之用,如有需求,请联系原作者。数据处理过程的数据类型当利用pandas进行数据处理的时候,经常会遇到数据类型的问题,当拿到数据的时候,首先需要确定拿到的是正确类型的数据,一般通过数据类型的转化,这篇文章就介绍pandas里面的数据类型(data types也就...

2019-06-21 09:31:44 2150

转载 pandas21 读csv文件read_csv(11.日期时间)(详细 tcy)

本文转自:https://blog.csdn.net/tcy23456/article/details/85292925仅为本人学习笔记之用,如有需求,请联系该文原作者。 # parse_dates,date_parser 指定列的日期/时间格式,将文本数据转换为datetime目录:第1部分:csv文本文件读写 pandas 读csv文件read_csv(1.文本读写...

2019-06-21 09:21:14 3542

转载 【Python】pandas轴旋转stack和unstack用法详解

本文转自:https://blog.csdn.net/Asher117/article/details/85047899仅作为个人笔记之用,如有其它需求,请联系该文原创作者。摘要前面给大家分享了pandas做数据合并的两篇[pandas.merge]和[pandas.cancat]的用法。今天这篇主要讲的是pandas的DataFrame的轴旋转操作,stack和unstack的用法。...

2019-06-20 14:04:43 1557

转载 Pandas透视表(pivot_table)详解

本文转自:https://www.cnblogs.com/onemorepoint/p/8425300.html本人只做笔记备忘之用,如有其它需求,请联系该文原作者。介绍也许大多数人都有在Excel中使用数据透视表的经历,其实Pandas也提供了一个类似的功能,名为pivot_table。虽然pivot_table非常有用,但是我发现为了格式化输出我所需要的内容,经常需要记住它的使用语...

2019-06-19 10:12:39 3456

转载 IV值和WOE值的理解

转自:https://blog.csdn.net/iModel/article/details/79420437这篇文章是我认为对IV和WOE解释比较好的博客,在做信贷领域风控建模的时候,我们针对评分卡模型,一般性的将数据自变量与因变量之间通过IV值做一次筛选,为便于以后查阅,自己全篇抄录下来,如有其他需要,请联系该文章原作者,谢谢。现在开始本文正文:1.IV的用途IV的全称是...

2019-06-14 09:37:43 959

转载 Python之如何删除pandas DataFrame的某一/几列

转自:https://www.cnblogs.com/rrttp/p/8116805.htmlPython之如何删除pandas DataFrame的某一/几列删除pandas DataFrame的某一/几列:方法一:直接del DF['column-name']方法二:采用drop方法,有下面三种等价的表达式:1. DF= DF.drop('column_name...

2019-06-13 17:54:38 3673

转载 Python生成的csv文件打开是乱码解决办法

本文转自:https://www.cnblogs.com/onelikeone/p/7751506.htmlexcel打开csv 出现乱码怎么解决https://jingyan.baidu.com/article/ac6a9a5e4c681b2b653eacf1.htmlCSV是逗号分隔值的英文缩写,通常都是纯文本文件。CSV格式是分隔的数据格式,有字段/列分隔的逗号字符和记录/行分...

2019-06-13 11:53:40 7271 1

转载 python中datetime.strptime(),strftime()的应用

本文转自:https://www.cnblogs.com/huzhe123/p/9308057.html,如有其他需要请联系原博主,仅供本人学习之用。atetime是模块,datetime模块还包含一个datetime类,通过from datetime import datetime导入的才是datetime这个类。strptime():用户输入的日期和时间是字符串,要处理日期和时间,...

2019-06-13 10:45:07 250

转载 Linux安装python3.6

转自:https://www.cnblogs.com/kimyeee/p/7250560.html

2019-04-26 15:50:59 119

转载 逻辑回归的常见面试点总结

本文转自:https://www.cnblogs.com/ModifyRong/p/7739955.html1.简介 逻辑回归是面试当中非常喜欢问到的一个机器学习算法,因为表面上看逻辑回归形式上很简单,很好掌握,但是一问起来就容易懵逼。所以在面试的时候给大家的第一个建议不要说自己精通逻辑回归,非常容易被问倒,从而减分。下面总结了一些平常我在作为面试官面试别人和被别人面试的时候,经...

2019-03-09 14:29:53 162

Excel图表实战技巧

Excel图表实战技巧精粹,适用于对excel操作学习者,欢迎大家下载学习

2018-01-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除