Python
Distrlili
这个作者很懒,什么都没留下…
展开
-
read_csv()报错
当用pd.read_csv( )出现 OSError: Initializing from file failed 问题时,一般是因为参数文件名或文件路径包含中文,所以改为f = open(path)data = pd.read_csv(f)即可解决。...原创 2020-03-05 19:47:31 · 445 阅读 · 0 评论 -
将Chrome设置为Jupyter_notebook的默认浏览器
1.获取Jupyter_notebook配置文件我们首先需要找到Jupyter_notebook的配置文件jupyter_notebook_config.py在哪里,配置文件里面保存着Jupyter_notebook的各种设置。打开Anaconda Promt,运行以下命令就可以得到配置文件的路径。用编辑器(我用的sublime)打开文件jupyter_notebook_config.py,...原创 2020-02-25 22:25:17 · 1214 阅读 · 1 评论 -
Jupyter Notebook 修改 默认路径
Jupyter Notebook 工作空间 / 默认路径 的设置方式Jupyter notebook启动后,默认的工作空间是当前用户目录。为了方便对文档进行管理,往往需要自行设置工作空间。下面介绍两种亲试有效的工作空间设置方法。第一步:修改快捷方式对 Jupyter notebook 快捷方式进行修改。右击 Jupyter notebook 快捷方式 -> 属性把“目标”中的 %...原创 2020-02-25 22:08:55 · 365 阅读 · 0 评论 -
离散变量的重编码
在建模的过程中离散型的字符变量是不能直接用于建模,需要对这些变量进行重编码。重编码的方法有多种,字符型的值转换为整数型的值、哑变量处理(0-1变量)、One-Hot热编码(类似于哑变量)。1.字符转数值的方法处理前的数据集:for feature in income.columns:if income[feature].dtype == ‘object’:income[feature...原创 2019-07-11 00:57:02 · 1261 阅读 · 1 评论 -
python——类型转换和冗余数据删除
1.类型转换import pandas as pdimport datetime一般我们拿到日期型数据时,基本都是字符串表示的,该如何将其转换为日期型和日期时间型。法1:dt = '2019/06/13 16:16:39'd = '2017-04-24'str2datetime = datetime.datetime.strptime(dt,'%Y/%m/%d %H:%M:%S'...原创 2019-06-28 15:19:55 · 1211 阅读 · 0 评论 -
groupby()函数的size()和count()用法
Data_loan.groupby(['DataPhase','CreditRank']).size().reset_index()Data_loan.groupby(['DataPhase','CreditRank'],as_index=False)['BorrowerState'].count()原创 2019-07-02 10:47:27 · 8672 阅读 · 0 评论 -
python -- apply() 求某列数据与其均值的差
已知一个DataFrame的数据集rr为:计算R_interval、F_value、M_value每列数据与其均值的差。若下面这样筛选数据则会报错,一直没找到具体原因。rr['R_interval'].apply(lambda x:x-x.mean()).head()但是若用双方括号则不会报错,如下图:![在这里插入图片描述](https://img-blog.csdnimg....原创 2019-06-18 12:44:11 · 3523 阅读 · 0 评论 -
lambda 与 if else 函数的用法
sourcedf[‘地区’]=sourcedf[‘exam_district’].apply(lambda x:“全国” if x1 else (“北京” if x3 else(“上海” if x==24 else “其他地区”)) )原文:https://blog.csdn.net/weixin_40161254/article/details/86231869...转载 2019-06-18 12:35:38 · 10912 阅读 · 0 评论 -
python基础
BIF——内置函数 组(suite):python 代码块,通过缩进来指示分组IDLE shell : ALT+P 前一个代码;ALT + N 表示下一个标志符是指示数据对象的名字。标识符没有类型,标识符所指示的数据对象有类型。列表是一个数据集合,数据项之间用逗号分隔,整个列表用中括号包围。列表可以存放任意数据,而且数据可以是混合类型。列表还可以包含其他列表。列表可以随需要伸...原创 2018-07-09 15:36:45 · 303 阅读 · 0 评论 -
Python 基础
工具:Python 3 IDE:Python3自带的IDLEIDLE可以区分颜色的语法来突出显示代码; IDLE很清楚Python的缩进语法; 输入部分代码,TAB键可以提供一些待选项提示; ALT-P 回退 ALT_N 移到下一个列表#创建一个列表movies=["The Holy Grail","The Life of Brain","The Meaning of ...原创 2018-05-28 23:20:55 · 362 阅读 · 0 评论