Python机器学习基础教程
文章平均质量分 84
Alex Tech Bolg
MSDS@Columbia University
展开
-
Docker Tutorial
Docker,JSON,YAML原创 2023-10-02 10:07:02 · 530 阅读 · 0 评论 -
Prompt Engineering
Principles:2. Give the model time to think.原创 2023-10-02 05:30:14 · 421 阅读 · 0 评论 -
Agile Development
Agile development: Make you won’t do extra workSprintProduct Backlog:User StoryTimeboxingSprint Planning MeetingSprint Review Meeting: deliverablesRetrospective meeting:Daily meeting:KISS: Keep it simple, stupid!Treat warnings as errors原创 2023-09-19 22:43:35 · 331 阅读 · 0 评论 -
词嵌入和交叉熵|Word Embedding and Cross Entropy
词嵌入,交叉熵损失函数,Word Embedding,Cross Entropy,Pytorch原创 2022-10-28 12:32:04 · 796 阅读 · 0 评论 -
Transformer和BERT学习笔记|Notes for BERT and Transformer
对每一个下游任务,构造一个跟这个任务相关的神经网络,将于训练好的表示,如词嵌入,作为一个额外的特征,和本来任务的输入一起输入到模型中。我希望这些特征已经有了比较好的表示,所以导致模型训练起来比较容易这两个途径都是使用一个相同的目标函数:都是使用语言模型,并且是单向的 (unidirectional language models)Bert 的改进:Masked Language model。原创 2022-10-12 20:32:43 · 586 阅读 · 0 评论 -
代理标签的半监督学习算法|Proxy-label Approaches for Semi-supervised Learning
Tri-training with disagreement 在原算法基础上做了个小调整(算法2Co-training中的第8行),要求对于模型。应该拒绝预测,也就是disagreement。置信度较高的样本,第三个模型。原创 2022-10-11 11:48:37 · 546 阅读 · 0 评论 -
自然语言处理教程-注意力模型|Natural Language Processing with Attention Models
NLP,Transformer,Bert原创 2022-10-07 06:15:39 · 541 阅读 · 0 评论 -
应用深度学习课程笔记|Review of 4995 Applied Deep Learning
Deep Dream里面能够改变的参数不是filter,而是input image,通过调整input image,来使得output image as high as possible (excites the layer)大部分的参数来自于最后一层dense layer,通过global average pooling可以极大减少参数数量。原创 2022-09-26 11:02:47 · 1181 阅读 · 0 评论 -
数据科学AWS实践1-AutoML|Analyze Datasets and Train ML models using AutoML
AWS, AutoML, Sagemaker, S3, Autopilot原创 2022-08-19 01:24:58 · 802 阅读 · 1 评论 -
吴恩达深度学习笔记3|Coursera Deep learning Notes - Structuring Machine Learning Projects
Deep learning, 吴恩达深度学习教程笔记原创 2022-07-25 00:34:43 · 703 阅读 · 0 评论 -
可解释机器学习- InterpretML的使用|interpretable machine learning- InterpretML tutorial
可解释机器学习,InterpretML原创 2022-07-15 11:49:13 · 2067 阅读 · 0 评论 -
可解释机器学习- LIME模型讲解|interpretable machine learning-LIME
可解释机器学习,interpretable machine learning,LIME,模型讲解原创 2022-07-15 11:47:08 · 4387 阅读 · 0 评论 -
吴恩达深度学习笔记及作业答案|Coursera Deep learning Notes - Improving Deep Neural Networks
Deep learning, dropout (inverted dropout), Early stopping, normalization, Improving Deep Neural Networks: Hyperparameter Tuning, Regularization and Optimization原创 2022-07-12 04:33:08 · 3479 阅读 · 0 评论 -
Review 4995 Applied Machine Learning
Table of contentsLecture 1Basic conceptExploratory Data Analysis & VisualizationLecture 2Supervised Learningk-nearest neighborsDevelopment-test splitRandom SplittingStratified SplittingStructured SplittingHyperparameter tuningModel selectionModel selec原创 2021-10-27 12:17:15 · 1782 阅读 · 0 评论 -
Machine Learning Review Note
目录Bagging, Boosting, StackingTF-IDFBagging, Boosting, Stackinghttps://towardsdatascience.com/ensemble-methods-bagging-boosting-and-stacking-c9214a10a205https://zhuanlan.zhihu.com/p/36822575The main hypothesis is that when weak models are correctl原创 2021-09-23 01:30:43 · 2311 阅读 · 0 评论 -
推荐系统入门实践
这里写目录标题数据代码数据代码原创 2021-05-27 13:00:26 · 95 阅读 · 0 评论 -
sklearn决策树可视化以及输出决策树规则
目录加载数据以文本的形式显示决策树规则决策树可视化关键参数加载数据from matplotlib import pyplot as pltfrom sklearn import datasetsfrom sklearn.tree import DecisionTreeClassifier from sklearn import tree# Prepare the data datairis = datasets.load_iris()X = iris.datay = iris.targe原创 2021-05-14 08:28:12 · 18484 阅读 · 2 评论 -
【时间序列】Prophet使用
目录1 Prophet 的安装2 快速上手3 预测值的上下限1 Prophet 的安装按照官网的指导安装就可以。一开始我用的是pip install fbprophet,不过提示我Microsoft Visual C++ 14.0 is required。然后我就去安装了Microsoft Visual Studio。安装完成之后,我试了用conda install -c conda-forge fbprophet。然后就安装好了。我也不知道是不是因为安装了C++,所以conda 安装就很顺利。不原创 2020-05-10 20:22:01 · 1588 阅读 · 1 评论 -
【时间序列】AR-MA-ARMA-ARIMA是什么?
目录11原创 2020-04-30 15:18:31 · 3646 阅读 · 0 评论 -
【时间序列】时间序列分析基本方法和实例
目录1 数据相关2 时间序列中的模型(Patterns)3 如何分解时间序列中的各个成分4 平稳与不平稳时间序列4.1 这些数据有什么明显的特点?4.2 为什么要在预测前把序列变成平稳的?4.3 如何对平稳性进行测试4.4 白噪音和平稳序列的区别5 如何去掉时间序列中的趋势6 如何去掉时间序列中的季节6.1 怎么测试序列中的季节性?7 缺失值的处理8 什么是自相关和偏自相关函数?1 数据相关2...原创 2020-04-28 18:00:36 · 17088 阅读 · 6 评论 -
【时间序列】怎么理解ACF 和PACF
目录1 概述2 Auto regressive (AR) process3 Moving average(MA) Process4 总结1 概述ACF 是一个完整的自相关函数,可为我们提供具有滞后值的任何序列的自相关值。简单来说,它描述了该序列的当前值与其过去的值之间的相关程度。时间序列可以包含趋势,季节性,周期性和残差等成分。ACF在寻找相关性时会考虑所有这些成分,因此它是“完整的自相关图...原创 2020-04-28 16:16:14 · 117379 阅读 · 10 评论 -
【时间序列】如何用差分让时间序列变得平稳-Python实践
目录1 概述2 平稳和非平稳时间序列3 让序列数据平稳4 差分转换4.1 线性增长的趋势4.2 季节性趋势5 总结1 概述时间序列数据集可能包含趋势和季节性,在建模之前可能需要将其删除。趋势可能导致随时间变化的平均值,而季节性可能导致随时间变化的方差(variance),这两者都将时间序列定义为不稳定的(non-stationary)。稳定(Stationary)数据集是具有稳定均值和方差...原创 2020-04-25 15:42:22 · 20717 阅读 · 0 评论 -
【时间序列】如何去掉时间序列数据中的季节性-Python实践
目录1 概述2 时间序列中的季节成分3 机器学习的好处4 季节性的类型4 消除季节性5 每日最低温度数据6 差分6.1 每日数据的差分6.2 月平均数据的差分7 通过建模来进行修正1 概述时间序列数据可能包含一些季节性的成分。这是一个随时间重复的循环,按照月度或者年度。这种重复的循环可能会对我们想要建模预测的信号产生干扰,反之会给我们的模型带来一个非常强的信号。在这个教程中,我们会学会如...原创 2020-04-24 13:51:08 · 28240 阅读 · 1 评论 -
梯度下降-最小二乘-scipy使用
目录1 概念2 区别3 scipy.optimize的使用1 概念最小二乘法:最小二乘法(又称最小平方法,Least squares)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟合。其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。...原创 2020-04-12 17:53:20 · 2048 阅读 · 0 评论 -
可解释机器学习-shap value的使用
可解释机器学习 interpretable machine learning, shapley value, shap, SHapley Additive exPlanations, Lightgbm, 回归 regression, 分类 classification,多分类 multi-classification原创 2020-03-16 15:50:29 · 32450 阅读 · 30 评论 -
非参数估计-高斯核平滑Gaussian kernel smoothing-非参数密度估计
目录1 概念1.1 核平滑的概念和计算1.2 Nadaraya-Watson回归1.3 高斯核2 高斯核平滑过程-Python实现2.1 加载库和生成数据2.2 Full Width at Half Maximum (FWHM)2.3 分步进行平滑2.4 二维平滑2.5 为什么要进行平滑1 概念1.1 核平滑的概念和计算核平滑是一种用来估计实值方程的统计方法,来作为周围观察数据的加权平均值。...原创 2020-03-09 17:28:42 · 21000 阅读 · 3 评论 -
广义加性模型Generalized additive models-pyGAM的使用
目录1 安装pyGAM2 分类案例2.1 基本使用2.2 部分依赖图(Partial dependency plots)2.3 调整光滑度和惩罚2.4 自动调参3 完整的pyGAM模型4 测试参数4.1 测试惩罚项4.2 测试样条函数的数量4.3 测试不同的约束5 小问题1 安装pyGAMpip install pygam在statsmodels.api中,也有GAM相关包。比如from.........原创 2020-03-06 01:14:38 · 14074 阅读 · 12 评论 -
线性模型-Ridge-Lasso-回归
目录1 基本库导入2 线性回归2.1 线性模型性能2.2 使用更高维的数据集3 岭回归-Ridge3.1 Ridge原理及应用3.2 Ridge调参3.3 为什么要用Ridge4 Lasso4.1 基本原理及应用4.2 Lasso调参4.3 为什么要用Lasso4.4 Lasso和Ridge的区别(L1,L2区别)5 相关概念5.1 模型偏差-模型方差5.2 多重共线性相关5.2.1 概念5.2....原创 2020-02-26 22:31:35 · 3680 阅读 · 0 评论 -
【机器学习基础教程】KNN-K临近算法
目录1 数据、库准备2 划分训练集和测试集3 检查数据4 KNN-K临近算法4.1 训练模型4.2 评估模型1 数据、库准备首先加载所用到的python库,并且导入鸢尾花的数据。import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport mglearnfrom sklearn.datasets ...原创 2020-02-26 00:28:17 · 265 阅读 · 0 评论