自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 数据分析系列 之python中数据获取与表示

1 本地数据获取1.1 文件的打开:语法file_obj = open(filename,mode=‘r’,buffering=-1)举例f1 = open(‘c:\ABC.txt’)f2 = open(‘c:\ABC.txt’,‘w’)f3 = open(‘c:\ABC.txt’,‘wb’,0)mode为可选参数,默认值为r;buffering也为可选参数,默认值为-1(0代表不缓冲,1或者大于1的值表示缓冲一行或者指定缓冲区大小),二进制文件可以不使用缓冲,但是文本文件必须使用缓冲。

2021-04-25 20:57:26 219

原创 数据分析系列 之python中range函数的使用

此部分作为前面循环博客的内容补充1 语法:range(start,end,step=1)range(start,end)range(end)其中:start 起始值(包含)end 终值(不包含)step 步长(不能为0)range(start,end,step=1) 不包含end的值range(start,end) 缺省step值为1range(end) 缺省start值为0,step值为12 举例:list(range(3,11,2))[3,5,7,9]list(range(

2021-04-24 17:07:44 620

原创 数据分析系列 之python中字典内容介绍

1 介绍字典是另一种可变容器模型,且可存储任意类型对象;字典的每个键值对用冒号分割,每个键值对之间用逗号分割,用花括号 { }表示,字典数据的存储是无序的,可以通过访问key来得到value;key一般是唯一的,value不需要唯一;value可以取任何数据类型,但key必须是不可变的,如字符串,数字或元组,这里列表不可以做key;类似于java语言中的map类型。2 创建字典和访问字典里的值dict = {'Name': 'ABC', 'Age': 20, 'Class': 'DEF'}p

2021-04-18 18:07:41 343 2

原创 数据分析系列 之python中元组内容介绍

1 介绍Python的元组与列表类似,不同之处在于元组的元素不能修改,元组使用小括号,列表使用方括号。基于此,Tuple 没有的方法有:(1) 不能向 tuple 增加元素,没有 append 、 extend 、insert 等方法;(2)不能从 tuple 删除元素,没有 remove 或 pop 方法;(3)不能在 tuple 中查找元素,没有 index 方法(index是查找而不是索引,索引直接用下标即可,如:t[0])。使用 tuple 的好处:(1) Tuple 比 list 操作

2021-04-18 17:41:09 148

原创 数据分析系列 之python中列表内容介绍

1 引言实际上来说,Python中没有数组的数据结构,但列表很像数组,另外在使用的时候Python的类数组应用可以分三种类型:(1) list 普通的链表,初始化后可以通过特定方法动态增加元素。定义方式:arr = [元素](2) Tuple 固定的数组,一旦定义后,其元素个数不能再改变。定义方式:arr = (元素)(3) Dictionary 词典类型, 即是Hash数组。定义方式:arr = {元素k:v}本篇小博客介绍列表的使用。2 创建数组(列表)只要把逗号分隔的不同的数据项使

2021-04-18 16:55:27 152 1

原创 数据分析系列 之python中字符串内容介绍

1 python中单引号、双引号、三引号的用法总结可以通过单引号或双引号创建字符串。例如:a=‘abc’; b=“123”使用两种引号的好处是可以创建本身就包含引号的字符串,而不需要使用转义字符。主要使用场景是:*本质上单引号和双引号都可以表示一个字符串,在使用时具体使用哪种符号取决于原字符串中包含哪种引号,这样用另外一种引号可以避免使用转义字符。*例如:a = "ABC"print(a)输出:ABCb = 'ABC"123"'print(b)输出:ABC"123"#字符串中本来含有单

2021-04-18 11:32:22 223 1

原创 数据分析系列 之python中遍历列表的几种方法

1 引入:接触过C++、java和python,目前经常使用的是java,C++和python也忘的差不多啦哈哈…但是呢python现在经常使用,写脚本做数据处理等如果现查资料,感觉也挺不方便的。干脆就几个常用的用途复习一下吧…2 正式开始:先从遍历复习吧,写惯了强语言的循环,现在看python的都有点看不懂了。方法1:使用for循环简单结构遍历如:examples = ["AAA","BBB","CCC","DDD"]for example in examples: print(examp

2021-04-14 14:01:54 4329

原创 办公软件系列 之excel应用3

这个小专题讲解一下Excel中averageif函数的使用方法:1 背景:在excel中可能会遇到这样的问题,如下面的数据:IDsSubIDsNumsAA110AA215BB112CC110CC220CC330需要按照第一列中的大类ID求平均数,对于A中平均数为12.5,B平均数为12,C平均数为20。2 怎样做:利用公式AVERAGEIF来做:=AVERAGEIF(A:A,A1,C:C)averageif函数的

2021-04-07 21:33:02 122

转载 数据分析系列 之FP-growth算法介绍

1 基本概念:FP-growth,即 Frequent Pattern Growth,它通过构建 FP 树(即 Frequent Pattern Tree)这样的数据结构,巧妙得将数据存储在 FP 树中,只需要在构建 FP 树时扫描数据库两次,后续处理就不需要再访问数据库了。这种特性使得 FP-growth 算法比 Apriori 算法速度快。FP 树是一种前缀树,由频繁项的前缀构成。2 两个名词:支持度 Support支持度 指某频繁项集在整个数据集中的比例。假设数据集有 10 条记录,包含{‘鸡

2021-04-07 15:49:13 1433

原创 数据分析系列 之pandas用例分析1

1 pandas介绍:pandas是基于NumPy的一种工具,它是python的一个数据分析包,最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来,目前由专注于Python数据包开发的PyData开发team继续开发和维护,属于PyData项目的一部分。常用数据结构有:Series:一维数组,与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近;DataFrame:二维的表格型数据结构。很多功能与R中的data.frame类

2021-04-07 15:05:38 167

原创 安卓开发系列 之安卓中TAB页的写法

1 介绍安卓中TAB页的功能与WEB开发类似,就是利用空间复用展示更多的信息,使用Tab标签页控件,可以在同一个空间里放置更多内容。TabActivity继承Activity,主要功能是实现多个activity或者view之间的切换和显示,要使用该类必须新建一个类来继承TabActivity,并且该类的xml配置文件中必须包含TabHost、TabWidget、FrameLayout三个视图(View),其中后面两个标签是前面一个标签的子标签,表示tab页的选项卡,相当于菜单页,表示显示内容的区域。2

2021-04-02 17:12:09 870

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除