- 博客(11)
- 收藏
- 关注
原创 数据分析系列 之python中数据获取与表示
1 本地数据获取1.1 文件的打开:语法file_obj = open(filename,mode=‘r’,buffering=-1)举例f1 = open(‘c:\ABC.txt’)f2 = open(‘c:\ABC.txt’,‘w’)f3 = open(‘c:\ABC.txt’,‘wb’,0)mode为可选参数,默认值为r;buffering也为可选参数,默认值为-1(0代表不缓冲,1或者大于1的值表示缓冲一行或者指定缓冲区大小),二进制文件可以不使用缓冲,但是文本文件必须使用缓冲。
2021-04-25 20:57:26 219
原创 数据分析系列 之python中range函数的使用
此部分作为前面循环博客的内容补充1 语法:range(start,end,step=1)range(start,end)range(end)其中:start 起始值(包含)end 终值(不包含)step 步长(不能为0)range(start,end,step=1) 不包含end的值range(start,end) 缺省step值为1range(end) 缺省start值为0,step值为12 举例:list(range(3,11,2))[3,5,7,9]list(range(
2021-04-24 17:07:44 620
原创 数据分析系列 之python中字典内容介绍
1 介绍字典是另一种可变容器模型,且可存储任意类型对象;字典的每个键值对用冒号分割,每个键值对之间用逗号分割,用花括号 { }表示,字典数据的存储是无序的,可以通过访问key来得到value;key一般是唯一的,value不需要唯一;value可以取任何数据类型,但key必须是不可变的,如字符串,数字或元组,这里列表不可以做key;类似于java语言中的map类型。2 创建字典和访问字典里的值dict = {'Name': 'ABC', 'Age': 20, 'Class': 'DEF'}p
2021-04-18 18:07:41 343 2
原创 数据分析系列 之python中元组内容介绍
1 介绍Python的元组与列表类似,不同之处在于元组的元素不能修改,元组使用小括号,列表使用方括号。基于此,Tuple 没有的方法有:(1) 不能向 tuple 增加元素,没有 append 、 extend 、insert 等方法;(2)不能从 tuple 删除元素,没有 remove 或 pop 方法;(3)不能在 tuple 中查找元素,没有 index 方法(index是查找而不是索引,索引直接用下标即可,如:t[0])。使用 tuple 的好处:(1) Tuple 比 list 操作
2021-04-18 17:41:09 148
原创 数据分析系列 之python中列表内容介绍
1 引言实际上来说,Python中没有数组的数据结构,但列表很像数组,另外在使用的时候Python的类数组应用可以分三种类型:(1) list 普通的链表,初始化后可以通过特定方法动态增加元素。定义方式:arr = [元素](2) Tuple 固定的数组,一旦定义后,其元素个数不能再改变。定义方式:arr = (元素)(3) Dictionary 词典类型, 即是Hash数组。定义方式:arr = {元素k:v}本篇小博客介绍列表的使用。2 创建数组(列表)只要把逗号分隔的不同的数据项使
2021-04-18 16:55:27 152 1
原创 数据分析系列 之python中字符串内容介绍
1 python中单引号、双引号、三引号的用法总结可以通过单引号或双引号创建字符串。例如:a=‘abc’; b=“123”使用两种引号的好处是可以创建本身就包含引号的字符串,而不需要使用转义字符。主要使用场景是:*本质上单引号和双引号都可以表示一个字符串,在使用时具体使用哪种符号取决于原字符串中包含哪种引号,这样用另外一种引号可以避免使用转义字符。*例如:a = "ABC"print(a)输出:ABCb = 'ABC"123"'print(b)输出:ABC"123"#字符串中本来含有单
2021-04-18 11:32:22 223 1
原创 数据分析系列 之python中遍历列表的几种方法
1 引入:接触过C++、java和python,目前经常使用的是java,C++和python也忘的差不多啦哈哈…但是呢python现在经常使用,写脚本做数据处理等如果现查资料,感觉也挺不方便的。干脆就几个常用的用途复习一下吧…2 正式开始:先从遍历复习吧,写惯了强语言的循环,现在看python的都有点看不懂了。方法1:使用for循环简单结构遍历如:examples = ["AAA","BBB","CCC","DDD"]for example in examples: print(examp
2021-04-14 14:01:54 4329
原创 办公软件系列 之excel应用3
这个小专题讲解一下Excel中averageif函数的使用方法:1 背景:在excel中可能会遇到这样的问题,如下面的数据:IDsSubIDsNumsAA110AA215BB112CC110CC220CC330需要按照第一列中的大类ID求平均数,对于A中平均数为12.5,B平均数为12,C平均数为20。2 怎样做:利用公式AVERAGEIF来做:=AVERAGEIF(A:A,A1,C:C)averageif函数的
2021-04-07 21:33:02 122
转载 数据分析系列 之FP-growth算法介绍
1 基本概念:FP-growth,即 Frequent Pattern Growth,它通过构建 FP 树(即 Frequent Pattern Tree)这样的数据结构,巧妙得将数据存储在 FP 树中,只需要在构建 FP 树时扫描数据库两次,后续处理就不需要再访问数据库了。这种特性使得 FP-growth 算法比 Apriori 算法速度快。FP 树是一种前缀树,由频繁项的前缀构成。2 两个名词:支持度 Support支持度 指某频繁项集在整个数据集中的比例。假设数据集有 10 条记录,包含{‘鸡
2021-04-07 15:49:13 1433
原创 数据分析系列 之pandas用例分析1
1 pandas介绍:pandas是基于NumPy的一种工具,它是python的一个数据分析包,最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来,目前由专注于Python数据包开发的PyData开发team继续开发和维护,属于PyData项目的一部分。常用数据结构有:Series:一维数组,与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近;DataFrame:二维的表格型数据结构。很多功能与R中的data.frame类
2021-04-07 15:05:38 167
原创 安卓开发系列 之安卓中TAB页的写法
1 介绍安卓中TAB页的功能与WEB开发类似,就是利用空间复用展示更多的信息,使用Tab标签页控件,可以在同一个空间里放置更多内容。TabActivity继承Activity,主要功能是实现多个activity或者view之间的切换和显示,要使用该类必须新建一个类来继承TabActivity,并且该类的xml配置文件中必须包含TabHost、TabWidget、FrameLayout三个视图(View),其中后面两个标签是前面一个标签的子标签,表示tab页的选项卡,相当于菜单页,表示显示内容的区域。2
2021-04-02 17:12:09 870
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人