数据分析
文章平均质量分 90
birdflyinhigh
这个作者很懒,什么都没留下…
展开
-
Python做数据分析中需要掌握的命令行知识-持续更新中
1. 命令行基础1. pwd 命令行大多数人通过图形用户界面(GUI)与计算机进行交互,视觉界面如下所示:这是Mac计算机上的桌面屏幕截图。每个程序都有一个图标,我们可以点击一个来启动相应的程序。在GUI出现之前,与计算机交互的最常用方式是通过命令行界面,我们也将其称为shell或终端(我们将在此任务中互换使用这些术语)。命令行界面让原创 2017-10-06 21:44:57 · 482 阅读 · 0 评论 -
Numpy基础知识一边通(上篇)
python 数据分析地址:http://item.taobao.com/item.htm?id=557746408785Numpy基础1.理解矢量化操作python之所以流行,是因为写程序确实方便。执行python程序的时候,程序交给python解释器执行。开发人员并不需要处理内存分配和清理等工作。python属于高级语言,书写快,但是执行慢;C语言属于低级语言,书写慢,但是执行快...原创 2018-09-26 13:34:48 · 326 阅读 · 1 评论 -
Pandas基础知识一边通(上)
Pandas基础前言1. 理解pandas和numpy2. 理解dataframe(2D数组)3. DF 选择列4. 列选择的简洁方式5. series选择行6. DF选择行总结: 使用通用公司: df.loc[row, column], row和column可以是单个标签,列表,标签切片,布尔索引7、 Series和DF的Describe方法8. 其他方法9. Pandas赋值10. 使用布尔索...原创 2018-10-11 11:52:25 · 483 阅读 · 0 评论 -
Pandas数据探索进阶
学习python和数据分析推荐地方: www.lynda.com获取lynda官网会员的方式:http://item.taobao.com/item.htm?id=557746408785Pandas数据探索进阶1. 前言当我们使用numpy的时候,我们使用数字作为索引取数;我们使用pandas的时候,我们使用label(标签)取数。 大多数时候,pandas使用标签取数非常的方便和快捷...原创 2018-10-12 17:46:30 · 746 阅读 · 0 评论 -
Numpy基础知识一边通(下篇)
python 数据分析地址:http://item.taobao.com/item.htm?id=557746408785Numpy 布尔索引1. Numpy读取csv文件# 使用Numpy读取csv文件import numpy as np taxi = np.genfromtxt('nyc_taxi.csv', delimiter=',', skip_header=True)# 获取...原创 2018-09-29 16:51:18 · 178 阅读 · 0 评论 -
superset二次开发之旅__如何添加echarts图表之韦恩图
superset是airbnb开源的一款BI产品,支持多种数据库连接,拥有丰富的图表类型,其部署方便,制作看板迅速,是小企业自助BI的不错选择。但是,里面的图表类型虽然多,很多常见的图表依然没有,最近遇到一个需求:添加echarts到superset图表类型。以下是研究过程。下面以添加echarts 韦恩图为例,展示如何添加superset新图表类型:echarts官网演示链接:echarts...原创 2018-10-10 17:40:45 · 8179 阅读 · 5 评论 -
python高级用法-如何在Flask模型类型中写装饰器
请自行围观!www.lynda.com作为全球一流的在线培训网站,一直以高质量的视频课程著称。其课程内容也是紧跟行业潮流,本人最近学了里面的系列课程Become A PythonProgrammer, 分享一下。课程链接:https://www.lynda.com/learning-paths/Developer/become-a-python-developer获取lynda.com永久会...原创 2018-10-19 18:13:18 · 841 阅读 · 0 评论 -
python实现列表去重的方法
本文用到的数据,可以加QQ跟群主获取:群名称:PYTHONERS-数据群 号:663468799学习python和数据分析推荐地方: www.lynda.com获取lynda官网会员的方式:get_lynda.com()方法1: 使用set函数goods = ["衬衫", "羊毛衫", "雪纺衫", "裤子", "高跟鞋", "袜子","雪纺衫", &原创 2018-11-21 14:50:25 · 2284 阅读 · 0 评论 -
AttributeError: 'module' object has no attribute 'X509_up_ref' 报错解决方法
@学习python和数据分析推荐地方: www.lynda.com获取lynda官网会员的方式:get_lynda_com()pip install requestsLooking in indexes: https://pypi.tuna.tsinghua.edu.cn/simpleCollecting requestsFrom cffi callback <function _...原创 2019-01-08 14:37:58 · 2566 阅读 · 0 评论 -
KNN(K近邻算法) 中超参数调优,如何生成所有的指标排列组合.
KNN(K近邻算法) 中超参数调优,如何生成所有的指标组合.在KNN算法中,参数的调优要么调整特征的组合,要么改变K值。一个常用但是简单的方式是,网格搜索(grid search).比如加入特征组包括:features = ['accommodates', 'bedrooms', 'bathrooms', 'beds', 'minimum_nights', 'maximum_nig...原创 2019-06-21 18:35:27 · 1291 阅读 · 0 评论 -
Pandas使用实例
Pandas使用实例更多详情需求: 使用pandas读取excel, 根据类目分类排序,然后对于每个类目的前15%添加标记import pandas as pdimport osfile_names = os.listdir('./')for each in file_names: if each.endswith('.xlsx'): file_na...原创 2018-07-31 14:22:17 · 2771 阅读 · 0 评论 -
01_Anaconda安装详细步骤
Anaconda安装步骤windows 下载地址: https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ 选择对应windows版本打开cmd, 输入conda会有反应打开anaconda 的图形界面,点击左侧环境选项,中间出现root, 点击open terminal, 输入conda会有反应。配置国内源conda c...原创 2018-07-20 15:46:37 · 268 阅读 · 0 评论 -
命令行操作项目练习
本文用到的数据,可以加QQ跟群主获取:群名称:PYTHONERS-数据群 号:663468799学习python和数据分析推荐地方: www.lynda.com 获取lynda官网会员的方式:get_lynda_com()-----------------------------------------------------------------------------------原创 2017-10-07 21:54:46 · 599 阅读 · 0 评论 -
1. Linux 终端命令快速复习
本文用到的数据,可以加QQ跟群主获取:群名称:PYTHONERS-数据群 号:663468799学习python和数据分析推荐地方: www.lynda.com 获取lynda官网会员的方式:get_lynda_com()1. 终端命令格式command [-options] [parameters]2. 查阅帮助信息com原创 2017-10-07 15:39:03 · 845 阅读 · 0 评论 -
python数据分析中的时间处理(2)
1. time模块我们可以使用time.gmtime()函数将时间转换成更加易读的形式。该函数使用timestamp作为参数,返回struct_time类的一个实例对象。该实例对象可以用来表示当前时间的一些属性。比如: tm_year: timestamp的年份tm_mon: timestamp的月份(1-12)tm_mday: timestamp的日期(1-31)tm_hour: 时间原创 2017-10-06 00:11:28 · 1466 阅读 · 0 评论 -
python做数据分析实例
本文用到的数据在评论区留下邮箱即可。本文通过对美国枪杀数据的探索,综合运用python做一些数据的提取和统计原创 2017-10-08 19:02:24 · 11037 阅读 · 26 评论 -
如何读取CSV文件,格式化数据,统计生日出现的次数
如何读取CSV文件, 并对生日出现的次数本文将使用python语言,导入一个CSV文件,对文件数据进行处理,然后统计其中各个时间的生日出现的次数读取CSV文件列表的操作字符串的不可变性函数的定义和调用如何同时列表中元素的个数数据格式 year month date_of_month day_of_week births 1994 1 1 6 8096原创 2017-10-04 13:16:46 · 1725 阅读 · 0 评论 -
利用Python做数据分析中的异常处理
写在前面的:本文用到的数据:http://www.evernote.com/l/AnzL68lV2tBPUKvrI7TmuERGir07Si-ZX9Q/学习python和数据分析推荐地方: www.lynda.com 获取lynda官网会员的方式:get_lynda_com()--------------------------------------------原创 2017-10-05 13:13:14 · 3270 阅读 · 0 评论 -
利用python做数据分析中如何理解列表,列表推导式
写在前面的:本文用到的数据,可以加QQ跟群主获取:群名称:PYTHONERS-数据群 号:663468799学习python和数据分析推荐地方: www.lynda.com 获取lynda官网会员的方式:get_lynda_com()本文将使用legislators.csv数据集,数据预览:原创 2017-10-05 15:36:26 · 769 阅读 · 0 评论 -
干货-运行Python脚本的命令行操作(2)
本文用到的数据,可以加QQ跟群主获取:群名称:PYTHONERS-数据群 号:663468799学习python和数据分析推荐地方: www.lynda.com 获取lynda官网会员的方式:get_lynda_com()----------------------------------------------------------------原创 2017-10-07 21:08:11 · 1344 阅读 · 0 评论 -
使用python读取csv并转化成list of list的方法
学习python和数据分析推荐地方:www.lynda.com获取lynda官网会员的方式:https://item.taobao.com/item.htm?id=588604400195很多面试题目都需要处理csv文件,以下是几种种处理csv文件的方法:方法一: 使用Python基础语言编写def read_csv(file_name): f = open(fil...原创 2018-03-25 11:30:25 · 43962 阅读 · 4 评论 -
数据分析一遍通之numpy -- --附带源数据
1.前言python之所以流行,原因之一是因为,python让编程变得容易。当执行python代码时,python解释器将代码转化为计算机能理解的二进制code,并执行。当我们运行Python程序时,我们不需要担心内存如何管理, 也不需要了解处理器如何执行。python将替我们处理这些事情。python作为一门高级语言,编写Python程序会变得特别快速,因为python解释器帮我们决定如...原创 2018-07-18 14:33:16 · 266 阅读 · 0 评论 -
如何从零搭建专业的jupyter notebook开发环境
1. 安装jupyter notebookpip3 install jupyter notebook2. 设置jupyter notebook远程操作设置远程登录密码(jupyter) python@ubuntu:~/Desktop/code$ pythonPython 3.7.3 (default, May 30 2019, 17:03:20) [GCC 5.4.0 20160...原创 2019-07-29 15:52:54 · 448 阅读 · 0 评论