pandas replace 替换功能function

pandas replace 替换功能function list like replace method dict like replace method regex expression import pandas as pd import nu...

2018-12-22 15:22:00

阅读数 31

评论数 0

pandas 处理文本数据

pandas 处理文本数据 import pandas as pd import numpy as np 常规的字符串操作 s = pd.Series(['A',"B","C",&am...

2018-12-11 23:42:00

阅读数 12

评论数 0

pandas 基础操作 更新

pandas 基础操作 更新 创建一个Series,同时让pandas自动生成索引列 创建一个DataFrame数据框 查看数据 数据的简单统计 数据的排序 选择数据(类似于数据库中sql语句) 另外可以使用标签来选择 通过位置获取数据 布尔值索引 设...

2018-12-09 20:42:00

阅读数 14

评论数 0

pandas 基础

pandas 基础 创建一个Series ,同时让pandas自动生成索引列 创建一个DataFrame数据框 查看数据 数据的简单统计 数据的排序 选择数据(类似于数据库中sql语句) 另外可以使用标签来选择 通过位置获取数据 布尔值索引 设定数值(...

2018-11-18 21:48:00

阅读数 8

评论数 0

机器学习-树模型理论(GDBT,xgboost,lightBoost,随机森林)

机器学习-树模型理论(GDBT,xgboost,lightBoost,随机森林) tree based ensemble algorithms 主要介绍以下几种ensemble的分类器(tree based algorithms) xgboost li...

2018-10-16 17:07:00

阅读数 11

评论数 0

GBDT 详解分析 转+整理

GBDT 详解分析 转+整理 GBDT DT 回归树 Regression Decision Tree 梯度迭代 GBDT工作过程实例 需要解释的三个问题 - 既然图1和图2 最终效果相同,为何还需要GBDT呢? - Gradient呢?不是“G”B...

2018-10-15 14:23:00

阅读数 15

评论数 0

kaggle homesite

kaggle homesite 时间格式的转化 查看数据类型 查看DataFrame的详细信息 填充缺失值 category 数据类型转化 模型参数设定 结论 该项目是针对kaggle中的homesite进行的算法预测,使用xgboost的skle...

2018-10-12 16:06:00

阅读数 22

评论数 0

美团店铺评价语言处理以及分类(tfidf,SVM,决策树,随机森林,Knn,ensemble)...

美团店铺评价语言处理以及分类(tfidf,SVM,决策树,随机森林,Knn,ensemble) 第一篇 数据清洗与分析部分 第二篇 可视化部分, 第三篇 朴素贝叶斯文本分类 支持向量机分类 支持向量机 网格搜索 临近法 决策树 随机森林 baggin...

2018-09-20 00:04:00

阅读数 13

评论数 0

Python变量访问权限控制

Python变量访问权限控制 oop1.py文件代码 # user/bin/python class Foo: def bar(self): print('ok') def hello(self, name): ...

2018-09-11 18:01:00

阅读数 8

评论数 0

加州房价预测数据预处理

加州房价预测数据预处理 目录 后续内容已经放在github上,篇幅过大就只能把数据预处理的部分整理在这里,然后把后续的算法的实现部分整理在github中 本文是该系列读书笔记的第二章数据预处理部分 获取数据 数据的初步分析,数据探索 地理分布 数据...

2018-09-07 09:45:00

阅读数 16

评论数 0

flask下载文件中文IE,Edge,Safari文件名乱码

flask下载文件中文IE,Edge,Safari文件名乱码 flask(0.11.2)+python3.6 兼容各个主流浏览器,已经过各种测试(chrome,firefox,safari,IE,Edge) quote是将文件名urlencode化,然后以...

2018-08-30 11:22:00

阅读数 9

评论数 0

numpy 中的reshape,flatten,ravel 数据平展,多维数组变成一维数组

numpy 中的reshape,flatten,ravel 数据平展,多维数组变成一维数组 numpy 中的reshape,flatten,ravel 数据平展,多维数组变成一维数组 import numpy as np 使用array对象 arr1=np...

2018-08-28 23:54:00

阅读数 38

评论数 0

numpy 中不常用的一些方法

numpy 中不常用的一些方法 作者:代码律动链接:https://zhuanlan.zhihu.com/p/36303821来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 挑战 1:引入 numpy 并查看 numpy 的...

2018-08-27 14:17:00

阅读数 15

评论数 0

pandas.DataFrame对行和列求和及添加新行和列

pandas.DataFrame对行和列求和及添加新行和列 pandas.DataFrame对行和列求和及添加新行和列 导入模块: from pandas import DataFrame import pandas as pd import numpy...

2018-08-27 13:49:00

阅读数 34

评论数 0

numpy中数据合并,stack ,concentrate,vstack,hstack

numpy中数据合并,stack ,concentrate,vstack,hstack 在python的numpy库中有一个函数np.stack(), 看过一些博文后觉得别人写的太复杂,然后自己有了一些理解之后做了一些比较简单的解释   np.stack 首...

2018-08-27 13:44:00

阅读数 17

评论数 0

sohu_news搜狐新闻类型分类

sohu_news搜狐新闻类型分类 数据获取 数据是从搜狐新闻开放的新闻xml数据,经过一系列的处理之后,生成的一个excel文件 该xml文件的处理有单独的处理过程,就是用pandas处理,该过程在此省略 import numpy as np impo...

2018-08-24 17:16:00

阅读数 15

评论数 0

pandas pivot_table 活学活用实例教程

pandas pivot_table 活学活用实例教程 pandas pivot_table 活学活用实例教程 导入相关数据分析的库 首先进行commentTime时间进行数据预处理 查看数据类型信息 最简单的透视表 直接敲击该函数,在notebook...

2018-08-20 23:51:00

阅读数 9

评论数 0

美团店铺评价语言处理以及文本分类(logistic regression)

美团店铺评价语言处理以及文本分类(logistic regression) 美团店铺评价语言处理以及分类(LogisticRegression) 第一篇 数据清洗与分析部分 第二篇 可视化部分, 第三篇 朴素贝叶斯文本分类 本文是该系列的第四篇 主要讨论逻...

2018-08-16 14:20:00

阅读数 14

评论数 0

基于pandas python sklearn 的美团某商家的评论分类(文本分类)

基于pandas python sklearn 的美团某商家的评论分类(文本分类) 美团店铺评价语言处理以及分类(NLP) 第一篇 数据分析部分 第二篇 可视化部分, 本文是该系列第三篇,文本分类 主要用到的包有jieba,sklearn,pandas,本...

2018-08-14 22:34:00

阅读数 21

评论数 0

基于pandas python的美团某商家的评论销售数据分析(可视化)

基于pandas python的美团某商家的评论销售数据分析(可视化) 基于pandas python的美团某商家的评论销售数据分析 第一篇 数据初步的统计 本文是该可视化系列的第二篇 第三篇 数据中的评论数据用于自然语言处理 导入相关库 from py...

2018-08-11 23:37:00

阅读数 11

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭