pandas
平原2018
大模型、知识库、智能问答,需要帮助,请留言或者私信
展开
-
Pandas进阶01--基础篇
一、Pandas简介 pandas是一个开源的,BSD许可的库,为Python编程语言提供了高性能,易用的数据结构和数据分析工具。 熊猫是NumFOCUS赞助的项目。二、pandas安装环境1、操作系统: windows 8.1 2、开发工具: • Anaconda 5.1 • Jupyter Notebook 3、 Python版本 • 3.6 4、第三方模块包...原创 2018-06-21 19:46:11 · 575 阅读 · 0 评论 -
pandas进阶02--高级应用篇
Pandas高级应用目录介绍: 1、pandas高级应用–数据合并 2、pandas高级应用–数据重塑和旋转 3、pandas高级应用–数据转化、清除重复数据 4、pandas高级应用–数据替换 5、pandas高级应用–数据拆分1、pandas高级应用–数据合并from pandas import Series,DataFrameimport pandas as ...原创 2018-06-22 17:47:33 · 3787 阅读 · 0 评论 -
pandas进阶03--高级应用篇
接上一篇:https://blog.csdn.net/sinat_30353259/article/details/80776905 目录介绍: 06、pandas高级应用–数据分割 07、pandas高级应用–数据的过滤和筛选 08、pandas高级应用–读写文件数据 09、pandas高级应用–数据的聚合及分组计算 10、pandas高级应用–分组计算apply文中用到的数据:...原创 2018-06-25 17:30:52 · 755 阅读 · 0 评论 -
解决pandas合并某一列的文本内容
最近在做文本聚类时遇到,需要把某列的文本内容统一合并,其实很简单。上代码import pandas as pddf = pd.DataFrame({'text':['今天天气不错,适合出去玩。', '最近在上海举办了中国进口博览会,', '各国大展拳脚,', '希望国家越来越好,', '人民越来越富。']})...原创 2018-11-06 16:44:27 · 5537 阅读 · 0 评论 -
pandas apply应用并行进程,多核加快运行速度
前言: 在进行数据处理的时候,我们经常会用到 pandas 。但是 pandas 本身好像并没有提供多进程的机制。本文将介绍如何来自己实现 pandas (apply 函数)的多进程执行。其中,我们主要借助 joblib 库,这个库为python 提供了一个非常简洁方便的多进程实现方法。注意:本文说的都是多进程而不是多线程。功能需求:为了匹配两个datafarme中相同的部分,并把【’是否购...原创 2018-11-07 10:11:48 · 21868 阅读 · 4 评论