机器学习
记录大学机器学习课程所学内容
好记性不如烂笔头!
菜鸟上路_lbz
初探编程世界,希望满载而归
展开
-
Win10下安装Pytorch及可能遇到的问题
准备工作:anaconda下新建一个环境用于pytorch的使用(anaconda环境新建教程)当你看完此教程后想必你已经更换了清华镜像源然而想要安装pytorch你还需要添加一个镜像在命令行键入:(也可以使用上方教程的添加方式)conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/...原创 2020-03-04 15:54:50 · 4092 阅读 · 2 评论 -
paddle:cudnn64_7.dll not found
安装飞桨深度学习报错出现cudnn64_7.dll not found或者 error: CUDNN_STATUS_NOT_INITIALIZED飞桨安装要求是:cuDNN 7.6+CUDA 10.0用pip安装,飞桨是不安装CUDA的,需要自行去英伟达下载安装完后,在C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\include有一个cudnn.h点进去这个就是版本号,用pytorch也可以看。如果没有cudnn.原创 2020-07-10 16:43:36 · 9283 阅读 · 3 评论 -
RuntimeError:CUDA device-side assert triggered
在学习Pytorch迁移学习-蚂蚁蜜蜂中,尝试将其改成人脸识别,结果报错RuntimeError:device-side assert triggered网上都说是label的原因,经过学习发现的确是这个的原因。model_ft = models.resnet18(pretrained=True)num_ftrs = model_ft.fc.in_features# Here the size of each output sample is set to 2.# Alternatively,原创 2020-05-08 23:56:49 · 274 阅读 · 0 评论 -
表示 (Representation):特征工程
传统编程的关注点是代码。在机器学习项目中,关注点变成了特征表示。也就是说,开发者通过添加和改善特征来调整模型。将原始数据映射到特征图 1 左侧表示来自输入数据源的原始数据,右侧表示特征矢量,也就是组成数据集中样本的浮点值集。 特征工程指的是将原始数据转换为特征矢量。进行特征工程预计需要大量时间。许多机器学习模型都必须将特征表示为实数向量,因为特征值必须与模型权重相乘。映射数值整数和浮点...原创 2020-04-24 22:49:40 · 594 阅读 · 0 评论 -
泛化 (Generalization):过拟合的风险
假设这些图中的每个点代表一棵树在森林中的位置。图中的两种颜色分别代表以下含义:蓝点代表生病的树。橙点代表健康的树。接下来,我们来看看图 1。您能设想出一个有效的模型来预测以后的生病或健康的树吗?花点时间在脑海里绘制一条弧线将蓝点与橙点分开,或者在脑海中圈住一些橙点或蓝点。然后再看看图 2,它显示某种机器学习模型如何将生病的树与健康的树区分开。请注意,该模型产生的损失非常低。损失很...原创 2020-04-23 00:22:17 · 798 阅读 · 0 评论 -
机器学习:降低损失
降低损失迭代方法迭代学习可能会让您想到“Hot and Cold”这种寻找隐藏物品(如顶针)的儿童游戏。在我们的游戏中,“隐藏的物品”就是最佳模型。刚开始,您会胡乱猜测(“w1 的值为 0。”),等待系统告诉您损失是多少。然后,您再尝试另一种猜测(“w1 的值为 0.5。”),看看损失是多少。哎呀,这次更接近目标了。实际上,如果您以正确方式玩这个游戏,通常会越来越接近目标。这个游戏真正棘手的地...原创 2020-04-05 23:04:24 · 351 阅读 · 0 评论 -
问题构建 (Framing):机器学习
什么是(监督式)机器学习?简单来说,它的定义如下:机器学习系统通过学习如何组合输入信息来对从未见过的数据做出有用的预测。下面我们来了解一下机器学习的基本术语。标签标签是我们要预测的事物,即简单线性回归中的 y 变量。标签可以是小麦未来的价格、图片中显示的动物品种、音频剪辑的含义或任何事物。特征特征是输入变量,即简单线性回归中的 x 变量。简单的机器学习项目可能会使用单个特征,而比较复杂...原创 2020-04-03 13:52:43 · 482 阅读 · 0 评论 -
关于tb双十一成交量
近日关于淘宝天猫双十一的数据造假在网上引起轩然大波,网友’尹立庆’4月24日在微博上声称天猫造假,其数据符合二次多项式式和三次多项式回归,拟合度达到99.4%,正好在学习机器学习的路上,利用所学知识来完成’尹立庆猜想’注:仅从技术角度学习,不代表个人立场,不信谣,不传谣。1 获取数据'''x_train为年份(方便计算同时去掉2000)y_train为成交额(单位:亿)year:预测年...原创 2019-11-14 13:33:59 · 689 阅读 · 1 评论 -
机器学习对新闻数据分类的逐步优化
'''第一种没有去除stopword,准确率0.844439728353141 '''from sklearn.datasets import fetch_20newsgroupsnews=fetch_20newsgroups(subset='all')from sklearn.cross_validation import train_test_splity=news.target...原创 2019-11-12 09:20:51 · 359 阅读 · 0 评论 -
机器学习初篇:sklearn手写数字识别
from sklearn.datasets import load_digitsimport matplotlib.pyplot as pltfrom sklearn.preprocessing import StandardScalerfrom sklearn.svm import LinearSVCdigits=load_digits()x_train=digits.data[:13...原创 2019-09-17 09:04:59 · 1948 阅读 · 0 评论 -
机器学习初篇:良/恶性乳腺癌肿瘤预测
#打开训练样本和测试样本import pandas as pddf_train=pd.read_csv('learn/breast-cancer-train.csv')df_test=pd.read_csv('learn/breast-cancer-test.csv')#良性肿瘤,恶性肿瘤df_test_negative=df_test.loc[df_test['Class']==2]...原创 2019-09-07 10:41:04 · 854 阅读 · 1 评论