自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 资源 (2)
  • 收藏
  • 关注

原创 flask下载文件中文IE,Edge,Safari文件名乱码

flask下载文件中文IE,Edge,Safari文件名乱码 flask(0.11.2)+python3.6兼容各个主流浏览器,已经过各种测试(chrome,firefox,safari,IE,Edge)quote是将文件名urlencode化,然后以适应Edge浏览器from urllib.parse import quote # for py...

2018-08-30 11:22:00 279

原创 numpy 中的reshape,flatten,ravel 数据平展,多维数组变成一维数组

numpy 中的reshape,flatten,ravel 数据平展,多维数组变成一维数组 numpy 中的reshape,flatten,ravel 数据平展,多维数组变成一维数组import numpy as np使用array对象arr1=np.arange(12).reshape(3,4)print(arr1)print(type(arr...

2018-08-28 23:54:00 5254

原创 numpy 中不常用的一些方法

numpy 中不常用的一些方法 作者:代码律动链接:https://zhuanlan.zhihu.com/p/36303821来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。挑战 1:引入 numpy 并查看 numpy 的版本。要求:这是第一步,以后我们使用 numpy 时都将用别名 np。# 答案import n...

2018-08-27 14:17:00 302

原创 pandas.DataFrame对行和列求和及添加新行和列

pandas.DataFrame对行和列求和及添加新行和列 pandas.DataFrame对行和列求和及添加新行和列导入模块:from pandas import DataFrameimport pandas as pdimport numpy as np生成DataFrame数据df = DataFrame(np.random.ran...

2018-08-27 13:49:00 9612

原创 numpy中数据合并,stack ,concentrate,vstack,hstack

numpy中数据合并,stack ,concentrate,vstack,hstack 在python的numpy库中有一个函数np.stack(), 看过一些博文后觉得别人写的太复杂,然后自己有了一些理解之后做了一些比较简单的解释 np.stack首先stack函数用于堆叠数组,其调用方式如下所示:np.stack(arrays,axis=0) ...

2018-08-27 13:44:00 2601

原创 sohu_news搜狐新闻类型分类

sohu_news搜狐新闻类型分类 数据获取数据是从搜狐新闻开放的新闻xml数据,经过一系列的处理之后,生成的一个excel文件该xml文件的处理有单独的处理过程,就是用pandas处理,该过程在此省略import numpy as npimport pandas as pd读取新闻文本文件,查看文本的长度df=pd.read_excel...

2018-08-24 17:16:00 944

原创 pandas pivot_table 活学活用实例教程

pandas pivot_table 活学活用实例教程 pandas pivot_table 活学活用实例教程导入相关数据分析的库首先进行commentTime时间进行数据预处理查看数据类型信息最简单的透视表直接敲击该函数,在notebook中可以查看该函数的参数多个索引列特定列的统计规定特定的聚合函数传入多个聚合函数传入colum...

2018-08-20 23:51:00 611

原创 美团店铺评价语言处理以及文本分类(logistic regression)

美团店铺评价语言处理以及文本分类(logistic regression) 美团店铺评价语言处理以及分类(LogisticRegression)第一篇 数据清洗与分析部分第二篇 可视化部分,第三篇 朴素贝叶斯文本分类本文是该系列的第四篇 主要讨论逻辑回归分类算法的参数以及优化主要用到的包有jieba,sklearn,pandas,本篇博文主要先用...

2018-08-16 14:20:00 1811

原创 基于pandas python sklearn 的美团某商家的评论分类(文本分类)

基于pandas python sklearn 的美团某商家的评论分类(文本分类) 美团店铺评价语言处理以及分类(NLP)第一篇 数据分析部分第二篇 可视化部分,本文是该系列第三篇,文本分类主要用到的包有jieba,sklearn,pandas,本篇博文主要先用的是词袋模型(bag of words),将文本以数值特征向量的形式来表示(每个文档构建...

2018-08-14 22:34:00 1479

原创 基于pandas python的美团某商家的评论销售数据分析(可视化)

基于pandas python的美团某商家的评论销售数据分析(可视化) 基于pandas python的美团某商家的评论销售数据分析第一篇 数据初步的统计本文是该可视化系列的第二篇第三篇 数据中的评论数据用于自然语言处理导入相关库from pyecharts import Bar,Pieimport pandas as pdimport n...

2018-08-11 23:37:00 2982 2

原创 基于pandas python的美团某商家的评论销售(数据分析)

基于pandas python的美团某商家的评论销售(数据分析) 数据初步的分析本文是该系列的第一篇 数据清洗 数据初步的统计第二篇 数据可视化第三篇 数据中的评论数据用于自然语言处理from pyecharts import Bar,Pieimport pandas as pdimport numpy as npimport matpl...

2018-08-08 23:52:00 1395

原创 python pandas 豆瓣电影 top250 数据分析

python pandas 豆瓣电影 top250 数据分析 豆瓣电影top250数据分析数据来源(豆瓣电影top250)爬虫代码比较简单数据较为真实,可以进行初步的数据分析可以将前面的几篇文章中的介绍的数据预处理的方法进行实践最后用matplotlib与pyecharts两种可视化包进行部分数据展示数据仍需深挖,有待加强#首先按照惯例导入...

2018-08-08 15:07:00 5277

原创 pandas category数据类型

pandas category数据类型 实际应用pandas过程中,经常会用到category数据类型,通常以string的形式显示,包括颜色(红,绿,蓝),尺寸的大小(大,中,小),还有地理信息等(国家,省份),这些数据的处理经常会有各种各样的问题,pandas以及scikit-learn两个包可以将category数据转化为合适的数值型格式,这篇主要介...

2018-08-02 15:53:00 12645

原创 pandas 数据类型转换

pandas 数据类型转换 数据处理过程的数据类型当利用pandas进行数据处理的时候,经常会遇到数据类型的问题,当拿到数据的时候,首先需要确定拿到的是正确类型的数据,一般通过数据类型的转化,这篇文章就介绍pandas里面的数据类型(data types也就是常用的dtyps),以及pandas与numpy之间的数据对应关系。主要介绍object,i...

2018-08-02 00:14:00 4720

sales-funnel.xlsx

pivot_table数据资源,可以用于参考pivot_table的练习资源,非常不错的的表格,大家可以下载

2020-03-14

兄弟连(lampbrother)linux课程pdf 资料

兄弟连视频课件2014版

2016-09-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除