自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 Torch-感知机的梯度推导实践

pytorch学习

2022-08-01 17:17:26 187

原创 决策树与随机森林

分类算法-决策树与随机森林信息熵决策树的划分依据之一-信息增益信息熵信息和消除不确定性是相联系的决策树的划分依据之一-信息增益信息增益:当得知一个特征条件之后,减少信息熵的大小常用决策树使用的算法ID3信息增益:最大的准则C4.5信息增益比:最大的准则CART回归树:平方误差最小分类树:基尼系数:最小的准则,在sklearn中可以选择划分的默认原则...

2021-07-13 15:51:24 88

原创 k-近邻算法

k-近邻算法分类算法的判定依据分类算法-k近邻算法(KNN)分类算法的判定依据分类算法的判断依据是目标值是离散型的分类算法-k近邻算法(KNN)定义:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。计算距离公式:K-近邻算法:需要做标准化处理...

2021-07-08 15:34:41 160

原创 机器学习-特征工程

机器学习-特征工程数据类型机器学习算法的分类分类回归Sklearn数据集Scikit-learn数据集API介绍获取数据集返回的类型数据集进行分割数据类型离散型数据:由记录不同类别个体的数目得到的数据,又称计数数据,所有这些数据全部都是整数,而且不能再细分,也不能进一步提高他们的精确度连续型数据:变量可以在某个范围内取任一数,即变量的取值可以是连续的,如,长度、时间、质量值等,这类整数通常是非整数,含有小数部分。注:只要记住一点,离散型是区间内不可分,连续型是区间内可分。机器学习算法的分类

2021-05-27 15:09:52 152

原创 机器学习概述

机器学习概述机器学习数据集的构成特征工程特征抽取DictVectorizer语法数据的特征处理skelearn特征预处理API**归一化**标准化缺失值处理方法机器学习机器学习是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测。目的:让机器学习程序替换手动的步骤数据集的构成机器学习的数据:文件csvmysql:1、性能瓶颈,读取速度2、格式不太符合机器学习要去数据的格式特征工程特征工程是将原始数据转换为更好地代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的模

2021-02-05 13:56:21 136

原创 机器学习-数学基础加强_数学分析

机器学习-数学基础加强_数学分析什么是机器学习导数常用的函数导数方向导数梯度凸函数一阶可微二阶可微凸函数举例概率论装箱问题与组合数的关系什么是机器学习对于某给定的任务T,在合理的性能度量方案P的前提下,某计算机程序可以自主学习任务T的经验E;随着提供合适、优质、大量的经验E,该程序对于任务T的性能逐步提高。这里最重要的是机器学习的对象:任务Task,T,一个或者多个经验Experience,E性能Performance,P即:随着任务的不断执行,经验的累积会带来计算机性能的提升。

2021-01-20 08:43:15 152

原创 时间序列

时间序列pandas时间序列生成一段时间pandas重采样pandas时间序列生成一段时间pd.data_range(start=None,end=None,periods=None,freq='D'start和end以及freq配合能够生成start和end范围内以频率freq的一组时间索引start和periods以及freq配合能够生成从start开始的频率为freq的periods个时间索引In [9]: import pandas as pdIn [12]: pd.date_ra

2021-01-18 16:36:59 175

原创 数据的合并和分组聚合

数据科学包-Day5字符串的离散化数据合并数据分组聚合索引和复合索引字符串的离散化import pandas as pdimport numpy as npfrom matplotlib import pyplot as pltfile_path="./datasets_IMDB-Movie-Data.csv"df=pd.read_csv(file_path)pd.set_option('display.max_columns',None)#统计分类的列表temp_list=df["Ge

2021-01-14 15:13:35 307

原创 数据科学包-Day4

数据科学包-Day4pandas的常用数据类型创建Series数组Series切片和索引pandas之读取外部数据DataFrame练习pandas取行或者列pandas-locpandas-bool索引缺失数据的处理pandas的常用数据类型Series一维,带标签数组DataFrame二维,Series容器创建Series数组t1=pd.Series([1,23,2,2,1],index=list("abcde"))t1a 1b 23c 2d 2e

2021-01-12 15:44:32 114

原创 数据科学包-Day3

数据科学包-Day3numpy数组numpy创建数组(矩阵)numpy数组的计算数组和数的计算数组和数组的计算轴numpy数据的读取numpy中的转置numpy中索引和切片numpy数值的修改numpy中bool索引numpy中三元运算符numpy中的clip(裁剪)numpy中的nan和inf数组的拼接数组的行列交换练习numpy更多好用的方法numpy生成随机数numpy均值的算法练习numpy数组一个在Python中做科学计算的基础库,重在数值计算,也是大部分Python科学数据库的基础库,多用于

2021-01-11 09:04:52 106

原创 数据科学包-Day2

数据科学包-Day2对比常用统计图绘制散点图对比常用统计图折线图以折线的上升或下降来表示统计数量的增减变化的统计图特点:能够显示数据的变化趋势,反映事物的变化情况。(变化)直方图由一系列高度不等的纵向条纹或线段表示数据分布的情况。一般用横轴表示数据范围,纵轴表示分布情况。特点:绘制连续性的数据,展示一组或者多组数据的分布状况(统计)条形图排列在工作表的列或行中的数据可以绘制到条形图中。特点:绘制连离散的数据,能够看到各个数据的大小,比较数据之间的差别。(统计)散点图用两组数据

2021-01-07 14:11:10 115

原创 数据科学包-Day1

数据科学包-Day1数据分析数据分析的流程matplotlib数据分析数据分析是用适当的方法对收集来的大量数据进行分析,帮助人们作出判断,以便采取适当运动。数据分析的流程matplotlib能将数据进行可视化,更直观的呈现使数据更加客观、更具说服力...

2021-01-06 10:26:49 63

原创 Python基础学习-模块

Python基础学习-模块模块和包标准库模块模块化编程模块化编程的流程模块的创建和测试代码模块的导入import语句导入from…import 导入import 语句和 from...import 语句的区别。__import __()动态导入模块的加载问题包 package 的使用模块和包Python 程序由模块组成。一个模块对应 python 源文件,一般后缀名是:.py。模块由语句组成。运行 Python 程序时,按照模块中语句的顺序依次执行。语句是 Python 程序的构造单元,用于创建

2020-12-29 11:58:05 125

原创 Python基础学习-文件处理

Python基础学习-文件处理文件操作(IO操作)文本文件和二进制文件文件操作相关模块概述创建文件对象 open()文本文件的写入基本的文件写入操作文件操作(IO操作)一个完整的程序一般都包括数据的存储和读取;我们在前面写的程序数据都没有进行实际的存储,因此 python 解释器执行完数据就消失了。实际开发中,我们经常需要从外部存储介质(硬盘、光盘、U 盘等)读取数据,或者将程序产生的数据存储到文件中,实现“持久化”保存。文本文件和二进制文件按文件中数据组织形式,我们把文件分为文本文件和二进制

2020-12-26 16:25:40 144

原创 Python基础学习-异常的解决思路

Python基础学习-异常的解决思路异常的本质_调试核心理念异常机制本质try...一个except结构try...多个except结构try...except...else结构try...except...fanally结构return语句和异常处理问题常见异常的解决with 上下文管理自定义异常类_raise抛出异常Pycharm开发环境的调试断点进入调试视图异常的本质_调试核心理念异常机制本质异常指程序运行过程中出现的非正常现象,例如用户输入错误、除数为零、需要处理的文件不存在、数组下标越界

2020-12-23 15:27:02 162 2

原创 Python基础学习-方法

Python基础学习-方法方法的重载方法的动态性私有属性和私有方法(实现封装)私有方法@property装饰器方法的重载方法的动态性Python是动态语言,我们可以动态的为类添加新的方法,或者动态的修改类的已有方法。#测试方法的动态性class Person(): def work(self): print("努力上班!")def playgame(y): print("{0}在玩游戏".format(y))p=Person()p.game=playgam

2020-12-21 16:47:10 125

Python基础学习-函数(二)

Python基础学习-函数(二)嵌套函数nonlocal关键字嵌套函数一般在什么情况下使用嵌套函数?封装-数据隐藏外部无法访问“嵌套函数”。贯彻DRY原则嵌套函数,可以让我们在函数内部避免重复代码。闭包#测试嵌套函数(内部函数)的定义def outer(): print("out running") def inner(): print("inner running") inner()outer()def printName

2020-12-16 11:54:13 76

原创 Python基础学习-函数

Python基础学习-函数内存分析变量的作用域(全局变量和局部变量)内存分析#测试函数也是对象def test(): print("wjwjwj")test()a=testa()print(id(test))print(id(a))print(type(a))wjwjwjwjwjwj15676160451281567616045128<class 'function'>变量的作用域(全局变量和局部变量)变量起作用的范围成为变量的作用域,不同作用域内同名

2020-12-11 14:43:25 186

原创 Python循环结构深入

Python基础学习-Day_5for循环和可迭代对象遍历可迭代对象range对象嵌套循环for循环和可迭代对象遍历for循环通常用于可迭代对象的遍历。for循环的语法格式如下:for-变量-in-i可迭代对象:循环体语句可迭代对象Python包含以下几种可迭代对象:1.序列。包含:字符串,列表,元组2.字典3.迭代器对象(iterator)4.生成器函数(generator)#!usr/bin/env python# -*- coding:utf-8 _*-"""@auth

2020-12-08 11:26:45 252

原创 Python基础-4

Python基础学习-Day_3字典字典字典是“键值对”的无序可变序列,字典中的每个元素都是一个“键值对”,包含:“键对象”和“值对象”。可以通过“键对象”实现快速获取,删除,更新对应的“值对象”。列表中通过“下表数字”找到对应的对象。字典中通过“键对象”找到对应的“值对象”。“键”是任意的不可变数据,比如:整数,浮点数,字符串,元组。但是:列表,字典,集合这些可变对象,不能作为“键”。并且“键”不可重复。“值”可以是任意的数据,并且可重复。一个典型的字典的定义方式:a={'name':'g

2020-11-13 10:23:14 130

原创 Python基础-3

Python基础学习-Day_3字符串拓展可变字符串运算符总结字符串拓展可变字符串原地修改字符串,可以使用io.StringIO对象或array模块。>>>import io>>>s="hello,jzm">>>sio=io.StringIO(s)>>>sio<_io.StringIO object at 0x02F462B0> #这是新的对象>>>sio.getvalue() #查看si

2020-11-05 16:33:09 223 1

原创 Python基础-2

Python基础学习-Day_2Python基本运用链式赋值系列解包赋值常量Python最基本内置数据类型整型浮点型布尔型字符串型运算符整数运算符浮点数除法模(取余)幂整数三进制使用int()实现类型转换:自动转型浮点数类型转换和四舍五入Python基本运用链式赋值链式赋值用于同一个对象赋值给多个变量。系列解包赋值系列数据赋值给对应相同个数的变量。>>>a,b=1,2>>>a,b=b,a>>>print(a,b)常量Python不支持

2020-11-03 16:16:14 290

原创 Python理论基础及简单编码尝试

Python基础学习-Day_1Python介绍python特点Python的使用环境Python的应用范围Python程序的构成构成结构使用注释及行连接符常用快捷键对象的基本组成和内存示意图对象内存图编程练习代码及显示标识符基本用法变量的声明、删除变量Python介绍Python是一种解释型、面向对象的语言。python特点1.程序编码非常简洁;2.免费开源;3.面向对象;4.资源库非常丰富;4.具有强大的可扩展性;5.上手易,面向的工作岗位多元化。Python的使用环境开发环境本质

2020-08-26 17:10:39 235

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除