数据挖掘学习笔记

第一章 python基础

1.4 python基本数据类型

#1.41数值类型
int,float,bool
#1.42字符串str
s1='abcd'
s2='''ab cd'''

1.4.3列表List

L1=[1,'a1',2,'aa']
#[1, 'a1', 2, 'aa']

1.4.4元组Tuple

处在元组中的元素不能修改

T1=(1,'a1')
T1=(1,'C1','A1')
#(1, 'C1', 'A1')

T1[1]=2
# 'tuple' object does not support item assignment
​
 

1.4.5集合

集合保持了元素的唯一性,对于重复的元素只取一个,集合不支持由序列取值

J1={266,3,'h'}
#{266, 3, 'h'}
​
J2={266,3,3,'h','a','A','h'}
#{'A', 3, 266, 'h', 'a'} 
​
J2[0]
#'set' object does not support indexing

1.4.6字典

①{键 : 值}

②键必须唯一,值不必唯一

③(1)键可以是数值,字符。

(2)值可以是数值,字符或者其他python数据结构

④需要由键取值

d1={1:1,'J':{266,2,2},'T':(3,'A'),'L':[5,5],3:'''6'''}
#{1: 1, 'J': {2, 266}, 'T': (3, 'A'), 'L': [5, 5], 3: '6'}
​
d1[3]
#'6'

1.5 python公有方法

1.5.2切片

#通用
s2='hello world!'
​
s2[0:]
#'hello world!'
​
s2[0:1]
#'h' 
#包左不包右
​
s2[:]
#'hello world!'
​
s2[-1]
#'!'
​
s2[0:5:2]
#'hlo'
#从s2[0]开始两步截取一次
#[开始索引:结束索引:步长]


s2[::-1]
#'!dlrow olleh'

1.5.3长度

(1)字符串的长度为字符串中所有字符的长度(空格也算)

(2)列表,元组,集合的长度为元素的个数

(3)字典的长度为键的个数

len(s2)

1.5.4统计

字符串,列表,元组可以进行统计

s2='hello world!'
max(s2)
#'w'

1.5.5确定成员变量

'e'in s2
#True

1.5.6删除变量

s2='''ab cd'''
del s2
s2
# name 's2' is not defined

1.6方法

1.6.1列表方法

L1=[1,'a1',2,'aa']
#1创建空列表 
L=list()
#L=[]

#2添加元素
L.append('H')

#3扩展列表
L.extend(L1)#可以和元组做一下对比

#某元素计数
L.count('H')

#返回某元素下标
L.index('H')

#元素排序 需要同为str或者int时
L.sort()

 
1.6.2元组方法

#1创建空元组
T=tuple()
T=()
#2元素计数
T1.count('a1')
#3返回下标
T1.index('a1')

#4元组连接
T+T1 #和列表做一下对比

1.6.3字符串方法

s1='abcd'
#创建空字符串
S=str()
​
#查找子串 查找子串开始出现的索引位置,没有找到则返回—1
#第一个参数为需要查找的子串,第二个参数为指定待查字符串的开始位置,第三个参数为指定待查字符串的长度
s1.find('a',1,len(s1))
​
#替换子串
#(被替换子串,替换子串)
s1.replace('a','aa')
​
#字符串连接 和元组一样用+ 和列表不一样
s1+S
​
#字符串比较
S==s1

1.6.4字典方法

#创建字典
d=dict()
d={}

#可以将嵌套元素转为字典(必须嵌套,length只能为2(1键1值))
d1=dict([[1,'aa']])
​
#获取字典值 由键获取对应的值 
d1.get(1)
​
#字典赋值
d.setdefault(2,['a','b'])

# 第一种 若键不存在则会抛出KeyError异常
person['city']
# 第二种 不会抛出异常,不存在则返回None,也可以设置默认返回值
person.get('city',"上海")
# 第三种 与第二种类似,区别在于setdefault方法会更新字典
person.setdefault('city', '上海')
————————————————
版权声明:本文为CSDN博主「从小就拽」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/q5841818/article/details/80551413

1.9函数

1 无返回值

2有一个返回值

3有多个返回值

def work(r):
    import math
    c=2*math.pi*r
    s=math.pi*r*r
    return(c,s)
work(1)

第二章 科学计算包numpy

1Numpy的核心基础是N维数组

数组中的元素要求同质即数据类型相同

(以下代码默认导入numpy包)

2.2.1创建数组


#嵌套列表(元素为元祖) 转为二维数组
L3=[(1,2),(3,4)]
L4=np.array(L3)
#嵌套元祖(元素为元祖) 转为三维数组
L5=((1,2),(3,4),(5,6))
L6=np.array(L5)
#numpy多维数组中的子数组必须具有相同的长度
d3 = [[1,2,3],[4,5,6],[7,8,9,10]]
A33 = np.array(d3)

 

2.2.2内置函数创建数组

#创建3行4列元素全为1的数组
z1 = np.ones((3,4))
#创建3行4列元素全为0的数组
z2 = np.zeros((3,4))


                
  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
这篇笔记主要介绍了Pandas模块的基本操作和使用方法。Pandas是Python中一个用于数据分析和处理的常用库,提供了高效的数据结构和数据分析工具,是进行数据处理和数据挖掘的重要工具之一。 一、Pandas数据结构 Pandas主要有两种数据结构:Series和DataFrame。 1. Series Series是一种类似于一维数组的对象,由一组数据和一组与之相关的标签(即索引)组成。Series的创建方式如下: ```python import pandas as pd # 通过列表创建Series s = pd.Series([1, 3, 5, np.nan, 6, 8]) # 通过字典创建Series s = pd.Series({'a': 1, 'b': 2, 'c': 3}) ``` 2. DataFrame DataFrame是一种二维表格数据结构,由一组数据和一组行索引和列索引组成。DataFrame的创建方式有很多种,最常用的是通过字典创建。例如: ```python import pandas as pd data = {'name': ['Tom', 'Jerry', 'Mike'], 'age': [18, 20, 22], 'gender': ['M', 'M', 'F']} df = pd.DataFrame(data) ``` 二、Pandas的基本操作 1. 数据读取 Pandas可以读取多种格式的数据文件,如CSV、Excel、SQL等。常用的读取CSV文件的方式如下: ```python import pandas as pd df = pd.read_csv('data.csv') ``` 2. 数据预处理 数据预处理是数据挖掘中非常重要的一部分,Pandas提供了很多方便的函数和方法来进行数据清洗和转换。常用的数据预处理函数和方法有: - 处理缺失值 ```python # 判断是否存在缺失值 df.isnull() # 删除缺失值 df.dropna() # 填充缺失值 df.fillna(value) ``` - 处理重复值 ```python # 删除重复值 df.drop_duplicates() ``` - 数据转换 ```python # 数据类型转换 df.astype() # 数据替换 df.replace() ``` 3. 数据分析 Pandas提供了各种数据分析和处理的方法和函数,常用的包括: - 统计函数 ```python # 计算平均值 df.mean() # 计算标准差 df.std() # 计算最大值和最小值 df.max(), df.min() ``` - 排序 ```python # 按照某列排序 df.sort_values(by='column_name') ``` - 数据聚合 ```python # 对某列数据进行分组求和 df.groupby('column_name').sum() ``` 以上是Pandas模块的基础内容,还有很多高级用法和技巧需要进一步学习和掌握。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值