学习数据挖掘的笔记

小伙伴们大家好~欢迎来和我一起学习数据挖掘,希望我的笔记能对你们的学习有一定的帮助,也希望你们对我的不足能多多的包容,对于我的错误能及时指出,互相学习,我们一起进步!

对数据进行操作有以下几个部分

数据的采集与存储

数据的预处理

数据的分析

数据的可视化展示

而数据挖掘就是这里面的第二部分和第三部分,也就是数据预处理和数据分析,但主要还是侧重于数据分析,但这二者并不是非此即彼,而是相互联系的。

numpy

今天学习了有关python中的一个第三方库numpy的用法,

和传统的第三方库一样,我们想要使用一个第三方库的时候,首先我们要对这个库,进行一个导入

import numpy as np

首先是使用np创建数据

a= np.argange(5)

当然还可以创建多维数组:

import numpy as np

b= np.array([np.arange(6),np.arange(6)])

创建了两个一维的数组,然后用numpy的array方法把他们组合成一个 新的数组。

数组之间可以进行运算

eg:m n 是两个数组

然后加减法乘除法就不用多说就是 result =m+n  result =m-n  result =m*n result =m/n

  其中数组这里有一个特殊的运算就是点乘  

                乘法(点乘)
                a = np.array([[1,2,3],[4,5,6]])
                b = np.array([4,5,6])
                In: np.dot(a,b) 
                Out:array([32, 77])

然后在学习的时候,我看教程上还有一种运算  向量与标量之间 的运算,我还特意去查了究竟什么是标量,感觉人就是退化了,标量都不记得是向量的“反义词了”哎~

- 标量 (Scalar):
	- 是只有大小(数值)的量,没有方向。
	- 例如:温度、质量、时间等。
	- 向量 (Vector):
	- 是既有大小又有方向的量。
	- 例如:速度、力、位移等。
	区别: 标量只需要一个数值来描述,而向量需要一个数值和一个方向来描述。向量通常用箭头表示,箭头的长度代表大小,箭头的方向代表方向。

下一个知识点呢就是数组的切片和索引,没有什么难度,可以给大家展示一个列题

# 引入numpy库
import numpy as np
# 定义cnmda函数
def ce(a,m,n):
    '''
    参数:
    a:是一个Numpy数组
    m:是第m维数组的索引
    n:第m维数组的前n个元素的索引
    返回值:
    ret: 一个numpy数组
    '''
    ret = 0
    # 请在此添加切片的代码,实现找出多维数组a中第m个数组的前n个元素 并赋值给ret
    #********** Begin *********#
    ret = a[m,:n]
    #********** End **********#
    return ret

然后是数组的堆叠于拆分

改变数组形状:
    - revel()拆解,将多维数组变成一维数组==a.revel()==
    - flatten()拉直,功能与ravel()相同,但是flatten返回的是真实的数组,需要分配新的内存空间,而ravel()仅仅是改变视图。
    - shape()使用元组改变数组形状。
    - transpose()转置

Numpy的拆分
    - 横向拆分
        np.hsplit(a,3)
    - 纵向拆分
        np.vsplit(a,3)
    - 深度拆分
       np.dsplit(a,3)

都非常的简单,大家可以找几个例子多练习,不然一会就忘了,大家有什么例子也可也share到评论区,我们一起学习~

Python数据挖掘学习笔记主要包括以下几个方面的内容:Python基础知识、Python爬虫技术、Python数据分析与数据挖掘。其中,Python基础知识部分介绍了Python编程语言的基本语法、数据类型、流程控制等内容,为数据挖掘学习打下了基础。Python爬虫技术部分介绍了如何使用Python编写爬虫程序,从网页中获取所需数据。Python数据分析与数据挖掘部分则介绍了使用Python进行数据分析和数据挖掘的相关技术和工具。 在Python数据挖掘中,还涉及到一些扩展库的使用,可以使用pip或apt-get进行安装,例如numpy库可以使用命令"sudo pip install numpy"或"sudo apt-get install python-numpy"进行安装。 另外,Matplotlib是Python中最常用的绘图库之一,主要用于绘制二维图形,也可以绘制简单的三维图形。下面是一个使用Matplotlib进行简单绘图的示例代码: ```python import numpy as np import matplotlib.pyplot as plt x = np.linspace(0, 10, 1000) y = np.sin(x) z = np.cos(x ** 2) plt.figure(figsize=(8, 4)) plt.plot(x, y, label='$\sin x$', color='red', linewidth=2) plt.plot(x, z, 'b--', label='$\cos x^2$') plt.xlabel('Time(s)') plt.ylabel('Volt') plt.title('A Simple Example') plt.ylim(0, 2.2) plt.legend() plt.show() ``` 这段代码使用了numpy库生成了一组x轴的数据,然后分别计算了对应的y轴和z轴的数值。接下来使用Matplotlib进行绘图,其中plt.plot函数用于绘制曲线,plt.xlabel和plt.ylabel分别设置x轴和y轴的标签,plt.title设置图的标题,plt.ylim设置y轴的范围,plt.legend用于显示图例,plt.show用于显示图形。 通过学习这些内容,你可以掌握Python数据挖掘的基本知识和常用技术,为进一步的学习和实践打下坚实的基础。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [python数据挖掘学习笔记](https://blog.csdn.net/yinghuoai/article/details/88392141)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* *3* [python数据挖掘笔记](https://blog.csdn.net/djm82755/article/details/101452842)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值