关闭
当前搜索:

学习Pandas(十一)

英文原文: 11 - Lesson 从多个 Excel 文件中读取数据并且在一个 dataframe 将这些数据合并在一起。 import pandas as pd import matplotlib import os import sys %matplotlib inline print('Python version ' + sys.version) print('P...
阅读(51) 评论(0)

学习Pandas(十)

英文原文: 10 - Lesson从 DataFrame 到 Excel 从 Excel 到 DataFrame 从 DataFrame 到 JSON 从 JSON 到 DataFrame import pandas as pd import sysprint('Python version ' + sys.version) print('Pandas version ' + pd....
阅读(78) 评论(0)

学习Pandas(九)

英文原文: 09 - Lesson 从微软的 sql 数据库将数据导出到 csv, excel 或者文本文件中。# 导入库 import pandas as pd import sys from sqlalchemy import create_engine, MetaData, Table, selectprint('Python version ' + sys.version) print('P...
阅读(60) 评论(0)

学习Pandas(八)

英文原文: 08 - Lesson 如何从微软的 SQL 数据库中抓取数据。# 导入库 import pandas as pd import sys from sqlalchemy import create_engine, MetaData, Table, select, engineprint('Python version ' + sys.version) print('Pandas vers...
阅读(66) 评论(0)

学习Pandas(七)

英文原文: 07 - Lesson 离群值 (Outlier)import pandas as pd import sysprint('Python version ' + sys.version) print('Pandas version ' + pd.__version__) Python version 3.6.1 | packaged by conda-forge | (defau...
阅读(76) 评论(0)

学习Pandas(六)

英文原文: 06 - Lesson 我们看一下 groupby 这个函数。# 导入库 import pandas as pd import sysprint('Python version ' + sys.version) print('Pandas version ' + pd.__version__) Python version 3.6.1 | packaged by conda-fo...
阅读(58) 评论(0)

学习Pandas(五)

英文原文: 05 - Lesson 我们将快速地看一下 stack 和 unstack 这两个函数。# 导入库 import pandas as pd import sysprint('Python version ' + sys.version) print('Pandas version: ' + pd.__version__) Python version 3.6.1 | packag...
阅读(57) 评论(0)

学习Pandas(四)

英文原文: 04 - Lesson 在这一课,我们将回归一些基本概念。 我们将使用一个比较小的数据集这样你就可以非常容易理解我尝试解释的概念。 我们将添加列,删除列,并且使用不同的方式对数据进行切片(slicing)操作。 Enjoy!# 导入需要的库 import pandas as pd import sysprint('Python version ' + sys.version) print...
阅读(55) 评论(0)

学习Pandas(三)

英文原文: 03 - Lesson 获取数据 - 我们的数据在一个 Excel 文件中,包含了每一个日期的客户数量。 我们将学习如何读取 Excel 文件的内容并处理其中的数据。 准备数据 - 这组时间序列的数据并不规整而且有重复。 我们的挑战是整理这些数据并且预测下一个年度的客户数。 分析数据 - 我们将使用图形来查看趋势情况和离群点。我们会使用一些内置的计算工具来预测下一年度的客户数。 表...
阅读(218) 评论(0)

学习Pandas(二)

英文原文: 02 - Lesson 创建数据 - 我们从创建自己的数据开始做数据分析。 这避免了阅读这个教程的用户需要去下载任何文件来重现结果。我们将会把这些数据导出到一个文本文件中这样你就可以试着从这个文件中去读取数据。 获取数据 - 我们将学习如何从文本文件中读取数据。 这些数据包含了1880年出生的婴儿数以及他们使用的名字。 准备数据 - 这里我们将简单看一下数据并确保数据是干净的,就是说...
阅读(58) 评论(0)

学习Pandas(一)

英文原文: 01 - Lesson 创建数据 - 我们从创建自己的数据开始。 这避免了阅读这个教程的用户需要去下载任何文件来重现结果。我们将会把这些数据导出到一个文本文件中这样你就可以试着从这个文件中去读取数据。 获取数据 - 我们将学习如何从文本文件中读取数据。 这些数据包含了1880年出生的婴儿数以及他们使用的名字。 准备数据 - 这里我们将简单看一下数据并确保数据是干净的,就是说我们将看一...
阅读(66) 评论(0)

Pandas秘籍【第九章】

原文:Chapter 9 import pandas as pd import sqlite3到目前为止,我们只涉及从 CSV 文件中读取数据。 这是一个存储数据的常见方式,但有很多其它方式! Pandas 可以从 HTML,JSON,SQL,Excel(!!!),HDF5,Stata 和其他一些东西中读取数据。 在本章中,我们将讨论从 SQL 数据库读取数据。您可以使用pd.read_sql函数从...
阅读(99) 评论(0)

Pandas秘籍【第八章】

原文:Chapter 8 import pandas as pd8.1 解析 Unix 时间戳在 pandas 中处理 Unix 时间戳不是很容易 - 我花了相当长的时间来解决这个问题。 我们在这里使用的文件是一个软件包流行度文件,我在我的系统上的/var/log/popularity-contest找到的。这里解释了这个文件是什么。# Read it, and remove the last ro...
阅读(81) 评论(0)

Pandas秘籍【第七章】

原文:Chapter 7 # 通常的开头 %matplotlib inlineimport pandas as pd import matplotlib.pyplot as plt import numpy as np# 使图表更大更漂亮 pd.set_option('display.mpl_style', 'default') plt.rcParams['figure.figsize'] = (1...
阅读(95) 评论(0)

Pandas秘籍【第六章】

原文:Chapter 6 import pandas as pd pd.set_option('display.mpl_style', 'default') figsize(15, 3)我们前面看到,Pandas 真的很善于处理日期。 它也善于处理字符串! 我们从第 5 章回顾我们的天气数据。weather_2012 = pd.read_csv('../data/weather_2012.csv',...
阅读(82) 评论(0)

Pandas秘籍【第四章】

原文:Chapter 4 import pandas as pd pd.set_option('display.mpl_style', 'default') # 使图表漂亮一些 figsize(15, 5)好的! 我们将在这里回顾我们的自行车道数据集。 我住在蒙特利尔,我很好奇我们是一个通勤城市,还是以骑自行车为乐趣的城市 - 人们在周末还是工作日骑自行车?4.1 向我们的DataFrame中刚添加...
阅读(73) 评论(0)

Pandas秘籍【第三章】

原文:Chapter 3 # 通常的开头 import pandas as pd# 使图表更大更漂亮 pd.set_option('display.mpl_style', 'default') figsize(15, 5)# 始终展示所有列 pd.set_option('display.line_width', 5000) pd.set_option('display.max_columns',...
阅读(101) 评论(0)

Pandas秘籍【第二章】

原文:Chapter 2 # 通常的开头 import pandas as pd # 使图表更大更漂亮 pd.set_option('display.mpl_style', 'default') pd.set_option('display.line_width', 5000) pd.set_option('display.max_columns', 60) figsize(15, 5)我们将在...
阅读(119) 评论(0)

Pandas秘籍【第一章】

第一章 原文:Chapter 1 import pandas as pd pd.set_option('display.mpl_style', 'default') # 使图表漂亮一些 figsize(15, 5) 1.1 从 CSV 文件中读取数据 您可以使用read_csv函数从CSV文件读取数据。 默认情况下,它假定字段以逗号分隔。 我们将从蒙特利尔(Montréal)...
阅读(75) 评论(0)
    个人资料
    • 访问:1087508次
    • 积分:16193
    • 等级:
    • 排名:第734名
    • 原创:313篇
    • 转载:774篇
    • 译文:123篇
    • 评论:275条
    博客专栏
    文章分类
    打赏
    如果你觉得我的文章对您有用,请随意打赏。 微信 支付宝