2018年05月_dark_tone

原创第十七章 pandas官方文档0.22中文教程---Tutorials（Practical data analysis with Python），个人渣翻译

Practical data analysis with Python（用Python进行实际的数据分析）本指南是对使用Python数据生态系统和一个有趣的开放数据集的数据分析过程的全面介绍。以下四个部分的内容如下: ①脏数据 ②聚合数据 ③可视化 ④时间序列指南原网址 Python for Data Science python数据科学我们致力于开源数据项目，...

2018-05-20 11:52:47 479

原创第十六章 pandas官方文档0.22中文教程---Tutorials（lessons 6 lessons 7），个人渣翻译

Lesson6 分组函数import pandas as pd# Our small data setd = {'one':[1,1,1,1,1], 'two':[2,2,2,2,2], 'letter':['a','a','b','b','c']}# Create dataframedf = pd.DataFrame(d)df# Create...

2018-05-20 11:20:59 259

原创第十五章 pandas官方文档0.22中文教程---Tutorials（lessons 4 lessons 5），个人渣翻译

Lesson 4 –添加/删除列-索引操作在这节课中我们将回到基础。我们将使用一个小的数据集，这样您就可以很容易地理解我要解释的内容。我们将添加列、删除列，并以许多不同的方式分割数据。享受吧!import pandas as pd# Our small data setd = [0,1,2,3,4,5,6,7,8,9]# Create dataframedf =...

2018-05-20 10:45:59 260

原创第十四章 pandas官方文档0.22中文教程---Tutorials（lessons 3 ），个人渣翻译

Lesson 3 创建函数，从EXCEL读取，导出到EXCEL - 异常值 - Lambda函数-切片和切块数据。import pandas as pdimport numpy.random as npimport matplotlib.pyplot as plt我们将创建自己的测试数据进行分析# set seednp.seed(111)# Function t...

2018-05-19 19:04:08 1159

原创第十三章 pandas官方文档0.22中文教程---Tutorials（lessons 2 ），个人渣翻译

Lesson 2 从TXT文件读取 -导出到TXT -选择顶部/底部记录-描述性统计-分组/排序数据我们首先创建我们自己的数据集进行分析。这将让用户无障碍阅读本教程，而不需要下载任何文件来复制下面的结果。我们将把这个数据集导出到一个文本文件中，这样您就可以从文本文件中获取一些数据。我们将学习如何在包含婴儿名字的文本文件中读取数据。数据包括出生在1880年的婴儿名字。在这里，我们...

2018-05-15 16:24:07 272

原创第十二章 pandas官方文档0.22中文教程---Tutorials（lessons 1 ），个人渣翻译

Lessons for New pandas Users 给新pandas用户上课。01-lesson：导入库——创建数据集——创建dataFrame——从CSV导出到写入CSV——查找最大值——绘制数据。创建数据–我们首先创建我们自己的数据集进行分析。这将预防让终端用户能阅读本教程，而不需要下载任何文件来复制下面的结果。我们将把这个数据集导出到一个文本文件中，这样您就可以从文本...

2018-05-13 19:24:05 521

原创第十一章 pandas官方文档0.22中文教程---Tutorials（有关cookbook），个人渣翻译

chapter 4 分组/聚合是我最喜欢的关于pandas的东西，我一直在用它。你应该读读这个好吧!我们回到我们的自行车路径数据集。我住在蒙特利尔，我很好奇，我们是不是更像是一个通勤城市，还是一个有趣的城市——人们在周末或工作日更喜欢骑车吗? 在dataframe中添加一个“工作日”列。首先，我们需要加载数据。我们这样做过bikes = pd.read_csv('../dat...

2018-05-12 17:33:06 1197

原创第十章 pandas官方文档0.22中文教程---Tutorials（有关cookbook），个人渣翻译

这是一个包涵许多pandas教程的指南，主要面向新用户。内部指南看10分钟入门pandas*（10 Minutes to pandas）更复杂的使用方法参看cookbookpandas cookbook这本cookbook的目标是给你一些具体的例子，让你从pandas开始。这些都是真实数据的例子，以及它所包含的所有错误和古怪。这里是v0.1版本的链接。对于最新的目录，请...

2018-05-12 15:09:58 2389 3

原创第九章 pandas官方文档0.22中文教程---总揽，个人渣翻译

pandas官方文档入口：pandas docs 0.22 个人准备进行渣翻译，增强记忆，能够系统性的了解一下pandas。整个文档组织从上到下分为： what’s new 各版本的添加，改变等信息集合。 installation ...

2018-05-12 12:55:06 669

原创第八章 groupby分组是什么？它有什么作用？深入理解层次化索引

学习到pandas的groupby功能的时候，相当迷惑，这玩意儿干嘛用的？网上查询了一下，全是具体的用法用列，要么就是从某些书本上“copy”下来的段落，也没清楚明白的讲groupby功能到底是什么。大概知道它和数据库操作比较类似，可惜我没有学过数据库，因此无法对比参照。至少我看那些文章，是越看越糊涂，它被发明出来解决什么问题的？想象一个如下的数据集：frame=pd.Data...

2018-05-11 16:12:26 4408

原创第七章对DataFrame行列数据修改的补充，对数据切片的补充

对第六章补充新增：查询资料后发现，delete方式会改动原始数据，不够安全，所以推荐用drop，这个方法不会修改原始数据，产生一个新对象。新增：添加行列除了用insert之外，如果只需要在最后一行一列添加，完全可以使用append方法，更简单的方法是直接赋值！对于如下df数据： #添加列df['人口']=['200','300','400','500','600']...

2018-05-11 11:23:39 1493

原创《python编程从入门到实践》读书笔记1~3章

p17 避免使用大写字母是个不错的主意，应使用小写字母和下划线。p19 3个字符串处理方法，.title()以首字母大写方式显示每个单词。 .upper()全部单词大写，.lower()全部单词小写。因为很多时候，你无法依靠用户来提供正确的大小写，因此需要把字符串预先转换为小写，再存储它们。以后需要显示这些信息时，再将其转换为最合适的大小写方式。p21 删除空白，在编程中，空白泛指任...

2018-05-04 04:57:05 819

原创第六章 pandas入门，改变series和DataFrame索引

增加或重排：重新索引reindex 删除：drop 对于一个已经建好的DataFrame对象，想要调整它的列索引顺序。使用.reindex(columns=)方法同理，使用.reindex(index=)方法，可以调整它的行索引顺序。总结：千万不要认为reindex仅仅是给索引改名，它是改变了key-values的关系，改变了整个DataFrame对象结构。添加...

2018-05-03 06:47:33 11077

原创第五章 pandas入门 DataFrame类型建立，获取行列数据，切片数据

DataFrame类型由共用相同索引的一组列组成，就是最熟悉的表格类型。纵向的索引叫做index（axis=0），横向的叫做columns（axis=1），既有行索引，也有列索引。 DataFrame常用于表达二维数据，但可以表达多维数据。可以由如下类型创建： ①二维ndarray对象。 ②由一维ndarray，列表，字典，元祖或series构成的字典 ③series类型 ④...

2018-05-03 04:43:30 15149 1

原创第四章 pandas series类型入门

认识pandas是python第三方库，提供高性能易用数据类型和分析工具。它引入了series和DataFrame两个数据类型。 series 索引+ 一维数据 DataFrmae 索引+ 二维数据 pandas的设计初衷，在于希望建立起数据与索引的对应关系，通过操作索引就能变相操纵数据，而不用关心数据的纬度，减轻思考负担。 pandas希望用户能像对待单一数据一样对待se...

2018-05-02 19:32:18 415

原创第三章 tushare数据接口包的认识

首先整个turshare数据可大概分为7个大类。交易类数据提供股票的交易行情数据，通过简单的接口调用可获取相应的DataFrame格式数据，主要包括以下类别：历史行情数据复权历史数据实时行情数据历史分笔数据实时报价数据当日历史分笔大盘指数列表大单交易数据投资参考数据投资参考提供一些可能会影响股票价格走势的信息数据，为投资者在做投资决策时提供数据参...

2018-05-02 07:56:53 3274 1

原创第二章财经数据接口包tushare 以及anaconda安装

初步学了一周的python了，大概摸索着开始学习股票的数据接口包。边练边学，边查询资料，这样效率应该能快一些。安装方式，因为tushare有一些前置依赖，官方推荐建议安装Anaconda（http://www.continuum.io/downloads），一次安装包括了Python环境和全部依赖包，减少问题出现的几率。 Anaconda的官网界面挺漂亮的，选择对应的操...

2018-05-02 06:33:32 5471 1

原创第十章程序设计方法简述，图形图像简介，不限于python

程序设计方法1.自顶向下的设计：基本思想把一个复杂的大问题，分解成多个小问题，再对小问题进行分解，最后一个一个得解决，通过解决所有小问题，达到解决整个大问题。开发者主要关注问题的分解，每一个小问题与其他小问题的接口（调用关系），每个小问题都可以用函数来表示，符合IPO流程，关注数据的输入（参数传递）和输出（函数返回），并不纠缠在实现细节上。2.自底向上的执行：通过从顶层分解到的小问题，...

2018-05-02 03:15:16 206

原创第一章 python数据分析的全流程，初步学习anaconda使用

整个流程可以大概分成四部分。 1. 数据获取：①本地获取，用户手工输入，或者以文本文件的形式读取，又或读取某个数据库；②网络获取，比如爬取信息，对信息解析，保存到文件，或者网站直接提供了api与数据下载。2.数据整理：把数据获取的部分，按我们需要的方式给整理完成，包括数据格式，数据的取舍，数据计算等等，又可以称为“数据清洗”，其目的是为了之后的数据分析，减轻分析的难度。3.数据分析：在整...

2018-05-01 09:13:19 5257

原创第九章循环结构和random库，蒙特卡罗方法

1.遍历循环 for <循环变量> in <遍历结构>: <语句块> 它的应用，计数循环，变量i可以使用，也可以不使用 for i in range(n): <语句块> 字符串遍历循环: for c in s: <语句块> 列表遍历循环: for item in ...

2018-05-01 05:53:58 422

原创第八章 vs2015 utf8 乱码+ 分支结构与异常处理

今天用vs2015编写简单的python程序，又出现乱码，non-utf8-code错误。这次不同于上次，源码么有任何问题，用idle可以正确执行。再次查询资料，现在搞清楚了。一种方式是每次编写完成后，去高级文件保存修改，但visual studio系列都无法自动默认设定。我查询了一下，最新的vs2017也不行。另一种方式就是使用forceUTF8 插件，上图中的地址已经过...

2018-05-01 04:13:21 376

暗色调的博客