机器学习笔记
文章平均质量分 68
经济学小白自学编程笔记整理,方便复习,防止丢失
ML_python_get√
这个作者很懒,什么都没留下…
展开
-
OpenAI Whisper and ChatGPT 语音助手
ChatGPT 、Whisper、gtts实现语音助手,利用gradio生成webui原创 2023-03-03 13:44:45 · 5418 阅读 · 2 评论 -
自学机器学习实战(peter harrington)KNN的python代码
机器学习实战之KNN提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结创造数据集和标签knn算法提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结创造数据集和标签knn算法前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基原创 2020-12-14 21:12:26 · 235 阅读 · 2 评论 -
自学机器学习实战(peter harrington)朴素贝叶斯的python代码
文章目录机器学习实战:朴素贝叶斯(垃圾邮件、词汇倾向)实验样本从词条表到词汇表将词转化为数值向量训练出条件概率贝叶斯分类器测试训练效果解析长字符串:URL等垃圾邮件分类RSS源中词汇倾向频率排序返回列表区域词汇倾向得到具有表征性的词汇用于测试的两个RSS机器学习实战:朴素贝叶斯(垃圾邮件、词汇倾向)# -*- Coding: UTF-8 -*-# bayes.py# @作者 ML# @创建日期 2020-12-13T13:16:03.065Z+08:00# @最后修改日期 2020-12-13T原创 2020-12-15 12:17:11 · 406 阅读 · 0 评论 -
自学机器学习实战(peter harrington)SVM+SMO算法的python代码
SVM获取数据阵和标签表选择αj剪辑变量坐标下降的方法,将原来的N个阿尔法利用坐标下降的方法简化为两个计算W可视化分类结果计算径向基核函数创建一个对象,用全局变量计算误差根据最大步长选择j将误差放在echache中作为全局变量储存完整的SMO优化过程完整的SMO算法测试径向基核函数的分类再看文本分类,先转化为向量处理所有文本的数据和标签利用SMO算法求解# -*- Coding: UTF-8 -*-# svmML.py# @作者 ML# @创建日期 2020-12-04T19:19:37.390Z+原创 2020-12-18 11:38:26 · 722 阅读 · 0 评论 -
自学机器学习实战(peter harrington)决策树及其可视化的python代码
机器学习实战之决策树练习数据集和特征标签计算集合的信息(熵)抽样:抽取某个特征取定值的数据集根据信息增益选出最好的特征多数投票原则给定数据和特征 生成决策树决策树可视化画箭头指向文本用于注释生成决策树图可视化判断结果 放在直线上计算叶节点数计算深度或者高度储存生成的树利用树进行分类树的储存和读取from math import logimport matplotlib.pyplot as pltimport pickle练习数据集和特征标签def createDataSet(): #原创 2020-12-20 20:54:18 · 267 阅读 · 0 评论 -
自学编程系列——3 面向对象编程
面向对象编程3.1 什么是面向对象编程3.2 访问可见性问题3.3 装饰器property3.4 继承和多态3.5 三个案例3.1 什么是面向对象编程把一组数据结构和处理它们的方法组成(对象)把相同行为的对象封装为(类)对象是类的实例类是对象的蓝图和模板 self简化名称通过类的(封装)隐藏内部细节通过(继承)实现类的特化和泛化通过(多态)实现基于对象类型的动态分派对象具有属性(静态特征)和行为方法(动态特征)抽取出来就是一个类from time import sleepfro原创 2021-07-11 17:21:37 · 228 阅读 · 0 评论 -
自学编程系列——1 正则表达式
正则表达式1.1 不使用正则表达式1.2 正则表达式总结:正则表达式步骤1.3 分组查找1.4 贪心匹配和非贪心匹配1.5 findall和search1.6 字符分类1.7 精准匹配1.8 compile第二个参数1.9 替代文本1.10 电话号码和邮件地址提取程序1.1 不使用正则表达式def isPhoneNumber(text): if len(text) !=12: return False for i in range(0, 3): if原创 2021-07-11 17:32:04 · 191 阅读 · 0 评论 -
自学编程系列——2 文件路径与文本读写
文件路径与文本读写2.1文件路径2.2读写文件2.3 shelve模块:常用2.4 pprint模块:简单数据类型2.5 项目实战2.1文件路径os模块工作空间不同系统不同路径格式绝对路径、相对路径创建新的文件夹os.path路径转换文件类型与大小文件是否存在import os path = os.getcwd()# 改变工作路径os.chdir('d:\\vs_code_python\\days_100\\res')# 连接路径path1 = os.path.j原创 2021-07-11 17:43:07 · 311 阅读 · 0 评论 -
自学编程系列——4 Numpy数组
numpy的学习4.1 notebook的使用4.2 numpy基础知识4.3 numpy的索引和切片4.4 numpy的基本运算4.5 numpy的数据处理4.6 numpy线性代数4.7 伪随机数的生成4.7 随机漫步实例import numpy as npimport matplotlib.pyplot as plt import pandas as pdimport seaborn as snsimport statsmodels as sm 4.1 notebook的使用# tab原创 2021-07-12 17:00:33 · 291 阅读 · 0 评论 -
自学编程系列——5 pandas入门
pandas的学习5.1 Series数据5.2 DataFrame创建总结: 创建方法5.3 索引对象5.4 pandas基本功能5.5 描述性统计import numpy as npimport pandas as pd from pandas import Series, DataFrameimport pandas_datareader.data as web5.1 Series数据索引运算:自动对齐缺失值、命名# Series 由一维数据和索引组成如时间序列数据,索引为时间原创 2021-07-15 12:14:01 · 200 阅读 · 0 评论 -
自学神经网络系列——1 编程基础知识
python基础知识1.1 变量类型1.1 变量类型整型、字符串、浮点型列表、字典、元组、布尔型print(type(10))print(type(str(10)))print(type(float(10)))# 变量的定义、计算、赋值# 在python中可以直接进行运算,也可以赋值给变量对变量进行运算a = 10print(a)a = 100print(a)b = 3.14print(a*b)# python属于动态语言,变量的类型会根据情况自动发生变化# 列表a原创 2021-07-19 12:16:06 · 139 阅读 · 0 评论 -
自学神经网络序列——2 感知机
感知机2.1 什么是感知机2.2 与或非2.1 什么是感知机接受多个输入信号,输出一个信号神经元:对输入的信号进行加权,如果加权数满足某一条件则输入1,否则输出0权重代表了信号的重要程度2.2 与或非与门:只有两个输入都为1时才输出1,其他情况输出0与非门:颠倒与门输出情况,只有两个输入都为1时才输出0,否则输出1或门: 只要有一个输入为1,那么输出1,只有全部输入为0,才输出0只要调整感知机的参数即可实现感知机在不同门之间的切换参数调整交给计算机来做,让计算机决定是那种门异或门原创 2021-07-19 12:18:32 · 202 阅读 · 0 评论 -
自学神经网络系列——3 初识神经网络
初始神经网络3.1 非线性函数的构造3.2 多维数组3.3 神经网络的实现3.4 手写数字识别3.1 非线性函数的构造任意曲线都可以用激活函数来构造任意曲线都是一些激活函数的和这些激活函数 偏置和权重不同两个ReLU函数才能构造一个阶跃函数或者sigmoid函数所以同样情况下ReLU的激活函数(神经元)需要增加一倍# 激活函数# 阶跃函数的实现import numpy as npdef step_func(x): if x >0: return 1原创 2021-07-19 12:24:39 · 224 阅读 · 0 评论 -
自学神经网络系列——4 神经网络的学习
神经网络的学习4.1 损失函数4.2 数值微分4.3 两层神经网络的学习4.4 神经网络的评价4.1 损失函数最小二乘极大似然交叉熵# 最小二乘损失函数import numpy as npy1 = [0.1,0.05,0.6,0.0,0.05,0.1,0.0,0.1,0.0,0.0]y2 = [0.1,0.05,0.1,0.0,0.05,0.1,0.0,0.6,0.0,0.0]t = [0,0,1,0,0,0,0,0,0,0]def mean_squared_error(y,t)原创 2021-07-19 12:30:04 · 211 阅读 · 0 评论 -
自学神经网络系列——5 反向传播算法
反向传播算法5.1 简单层的实现5.2 神经网络激活层的实现5.3 输入输出层的实现5.4 误差反向传播法的实现5.1 简单层的实现反向传播利用计算图理解基本原理是链式法则# 乘法层class MulLayer: def __init__(self): self.x = None self.y = None def forward(self,x,y): self.x = x self.y = y原创 2021-07-19 12:32:19 · 281 阅读 · 0 评论 -
自学神经网络系列——6 优化算法的改进
优化算法的改进6.1 参数的更新6.1.1 SGD6.1.2 Momentum6.1.3 AdaGrad6.1.4 Adam6.2 权重的初始值6.3 激活值标准化6.4 正则化6.5 超参数的验证6.1 参数的更新SGDMomentumAdaGradAdam6.1.1 SGD简单但可能没有效率,比如f = 0.05x2+y2梯度方向:可能并不指向最低点局部最小和全局最小`import matplotlib.pyplot as pltfrom mpl_toolkits.mplo原创 2021-07-19 12:35:05 · 390 阅读 · 0 评论 -
自学机器学习系列——1 机器学习基本框架
机器学习基本框架1 机器学习基本思路1.1 模型选择1.2 模型评价2 常见的机器学习方法2.1 广义线性模型2.2 线性判别分析和二次判别分析2.3 支持向量机2.4 决策树和随机森林2.5 神经网络和深度学习2.6 KNN2.7 聚类2.8 降维1 机器学习基本思路介绍机器学习基本框架: 数据获取、特征提取、数据转换、模型训练、模型选择、模型评价监督学习:给出原始特征和问题标签,挖掘规律,学习一个模式,回答新的问题无监督学习:仅仅根据原始特征寻找模式强化学习:最大化回报,没有绝对正确的标原创 2021-07-19 12:50:24 · 1546 阅读 · 0 评论 -
自学神经网络系列——7 前馈神经网络前置知识
7 全连接神经网络 总结一 感知机算法1 模型形式2 线性分类器3 存在问题4 python实现(1)与门(2)与非门(3)或门5 多层感知机解决异或问题二 神经网络结构1 常见的激活函数(1)sigmoid 激活函数(2)Tanh激活函数(3)Relu激活函数(4)Leaky Relu(5)Softplus激活函数(6)其他激活函数2 网络结构(1)前馈神经网络(2)循环神经网络(3)图神经网络一 感知机算法1 模型形式z=∑i=0Dwdxd+bz = \sum_{i=0}^D w_dx_d+原创 2022-02-14 20:36:39 · 1675 阅读 · 0 评论 -
自学神经网络系列 —— 8 前馈神经网络
8 前馈神经网络1 前馈神经网络结构1.1 网络结构1.2 网络模型2 前馈神经网络参数的学习2.1 目标函数2.2 梯度下降3 误差反向传播算法4 tensorflow中自动梯度计算原理5 深度学习中的非凸优化阅读文章之前需要了解的内容见前馈神经网络前置知识这篇文章,主要包括感知机算法、激活函数等知识,下面主要介绍前馈神经网络的内容,主要有:8.1 前馈神经网络结构8.2 神经网络参数的学习8.3 误差反向传播算法8.4 tensorflow中自动梯度计算原理8.5 机器学习或者深度学习中的原创 2022-02-15 23:15:27 · 1216 阅读 · 0 评论 -
自学神经网络系列—— 9 卷积神经网络CNN
卷积神经网络1 卷积神经网络背景2 卷积神经网络的基础知识2.1 卷积2.2 卷积神经网络结构2.3 卷积核的填充和步幅3 卷积神经网络的学习3.1 卷积的导数3.2 反向传播算法4 其他卷积1 卷积神经网络背景CNN(Convolution Neural Network)是一种包含卷积层、池化层的前馈神经网络,主要用于处理图像信息、文本信息。卷积神经网络用于处理图像,旨在解决全连接神经网络参数过多的问题。例如将一个1000像素的彩色图像展开1000×1000×3=3M维的向量,假设隐藏层大小为10原创 2022-02-16 19:57:50 · 1067 阅读 · 1 评论 -
自学神经网络系列—— 10 循环神经网络 RNN
循环神经网络是一种动态建模方法,常用于序列分析,比如本文序列建模、时间序列预测等等。原创 2022-02-17 19:39:15 · 946 阅读 · 0 评论 -
自学神经网络系列—— 11 门控循环神经网络 GRU和LSTM
门控循环神经网络LSTM和GRU原创 2022-02-18 17:08:13 · 1388 阅读 · 0 评论