Jupyter Notebook
文章平均质量分 96
Yale曼陀罗
用数字剥开俗世的纷繁外衣~坚持做精品知识专栏的公益传播者,尊重知识积累、共享学术成果~
展开
-
Jupyter Notebook配置使用总结
Jupyter Notebook配置使用总结1 修改jupyter notebook的默认工作路径1 修改jupyter notebook的默认工作路径Windows下jupyter notebook的默认工作路径一般为:c:\Users\用户名。长期保持此状态会影响电脑运行速度,且不便于与GitHub进行交互和文件管理。因此,一般应在安装Jupyter Notebook后对其默认工作路径进行...原创 2019-05-05 17:42:56 · 737 阅读 · 0 评论 -
高斯分布基本概念及Python生成高斯分布数据集
高斯分布基本概念及Python生成高斯分布数据集正态分布的基本概念利用python随机产生多维高斯分布点正态分布的基本概念正态分布,又称高斯分布。其特征为:中间高、两边低,左、右对称。其主要性质如下:集中性:曲线的最高峰位于正中央,且位置为均数所在的位置。对称性:正态分布曲线以均数所在的位置为中心、左右对称,且曲线两端无线趋近于横轴。均匀变动性:正态分布曲线以均数所在的位置为中心均匀向...原创 2019-08-20 12:55:49 · 14550 阅读 · 1 评论 -
实战项目一:地铁人流量预测
项目简介地铁人流量预测项目背景项目宗旨项目简介01数据清洗;02特征提取;03数据初步分析;04数据深度分析05数据模型的创建;06数据模型的评估07模型的优化改进08引入复杂模型——XGBoost地铁人流量预测项目背景为了帮助纽约市的地铁运输管理局(MTA)省钱并使地铁更安全;为了更准确地预测每日将有多少人访问某些地铁站点,从而让MTA更好地分配员工并预测否则会出乎意料的高峰期。项...原创 2019-08-20 12:54:12 · 20606 阅读 · 42 评论 -
独热编码One-Hot-Encoding与哑编码dummies、factorize的区别、联系
One-Hot-Encoding与dummies、factorize的区别、联系独热(onehot)编码基本知识点Pandas中dummies、factorize的用法详解pd.factorize()与哑变量变换pd.get_dummies()相较的优势get_dummies()与factorize()的区别pd.get_dummies()的用法详解pd.factorize()的用法详解sklea...原创 2019-08-08 09:00:50 · 2497 阅读 · 0 评论 -
def __init__(self)和def __init__(self, 参数1,参数2,···,参数n)的用法详解
def init(self)形式这种形式在__init__方法中,只有一个self,指的是实例本身,包含两个属性,name, score。它允许定义一个空的结构,当新数据来时,可以直接添加。实例化时,需要实例化之后,再进行赋值。class Game:# 定义Game类 def __init__(self): #创建类中的函数,也叫方法 self.name=None ...原创 2019-07-30 12:41:14 · 19543 阅读 · 3 评论 -
pandas批量读入Excel、CSV类型文件
pandas批量读入Excel、csv类型文件pandas批量读入Excel文件pandas批量读入Excel文件Step1:导入模块import pandas as pdimport osStep 2:指定存放文件的地址dir_str=r'D:\000-mine\richang2019\促首充\原始数据集\0613' #指定存放文件的地址Step 3:获取指定文件夹下所有Ex...原创 2019-07-29 09:42:13 · 2893 阅读 · 3 评论 -
groupby函数详解
pandas中groupby函数用法详解1 groupby()核心用法2 groupby()语法格式3 groupby()参数说明4 groupby()典型范例1 groupby()核心用法(1)根据DataFrame本身的某一列或多列内容进行分组聚合,(a)若按某一列聚合,则新DataFrame将根据某一列的内容分为不同的维度进行拆解,同时将同一维度的再进行聚合,(b)若按某多列聚合,则新D...原创 2019-06-06 13:40:19 · 130771 阅读 · 17 评论 -
pandas中.loc和.iloc以及.at和.iat的区别
pandas中.loc和.iloc以及.at和.iat的区别显示索引和隐式索引显示索引和隐式索引import pandas as pddf = pd.DataFrame({‘姓名’:[‘张三’,‘李四’,‘王五’],‘成绩’:[85,59,76]})#传入冒号‘:’,表示所有行或者列#显示索引:loc,第一个参数为index切片,第二个为columnsdf.loc[2] #index为...原创 2019-06-05 14:35:08 · 29206 阅读 · 0 评论 -
Python 正则表达式学习总结
Python 正则表达式学习总结1 正则表达式基础知识点1.1 正则表达式的概念2 正则表达式常用函数:2.1 compile 函数详解1 正则表达式基础知识点1.1 正则表达式的概念正则表达式:通常被用来检索、替换那些符合某个模式(规则)的文本。2 正则表达式常用函数:2.1 compile 函数详解compile 函数:根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对...原创 2019-06-05 14:34:15 · 969 阅读 · 0 评论 -
Pandas处理日期数据的常见操作集锦
Pandas处理日期数据的常见操作集锦数据读取及整理1.1 Series的创建方法数据读取及整理将数据类型转换为日期类型 df['date'] = pd.to_datetime(df['date'])将date设置为index df = df.set_index('date')获取某年的数据 print(df['2010'].head())获取某月的数据 p...原创 2019-06-05 14:32:45 · 22375 阅读 · 1 评论 -
python 常用操作集锦
python 常用操作集锦1 pandas常用操作语句1.1 全部读取数据1.2 局部读取数据1.3 设置行、列索引1.n 导出数据1 pandas常用操作语句1.1 全部读取数据读取.xlsx格式数据语法格式:pda.read_excel('filename',sheetname=k,header=None,encoding=utf-8)参数说明:sheetname=k:表...原创 2019-06-05 14:31:55 · 1191 阅读 · 0 评论 -
Jupyter Notebook常用快捷键详解
Jupyter Notebook常用快捷键详解快捷键作用备注Enter转入编辑模式Up选中上方单元K选中上方单元Down选中下方单元J选中下方单元Shift-K连续选择上方单元Shift-J连续选择下方单元A在上方插入新单元B在下方插入新单元X剪切选中的单元C原创 2019-06-05 14:31:24 · 860 阅读 · 0 评论 -
GitHub入门使用指南
github入门使用指南github Desktop使用操作指南github Desktop使用操作指南点击"Commit to master"只是让Github客户端记录这次进行的改动,相当于一次游戏存档,在将来的某一天如果想重玩这个存档,可以点击上面的圆圈“读取存档”,让项目恢复到这次记录的状态。...原创 2019-05-22 17:43:46 · 495 阅读 · 0 评论 -
pandas中eval函数详解
pandas中eval函数详解eval函数的常见用法将字符串对象转换为具体对象1 将字符串列表转换为列表2 将字符串元组转换为元组3 将字符串字典转换为字典pandas.DataFrame.eval函数详解eval函数的常见用法将字符串对象转换为具体对象1 将字符串列表转换为列表a='[[1,2],[3,4],[5,6]]'b=eval(a)2 将字符串元组转换为元组a=’([1,...原创 2019-08-20 12:59:11 · 9125 阅读 · 0 评论