Machine Learning
王发北
这个作者很懒,什么都没留下…
展开
-
使用神经网络进行微积分运算
大家上学时,最头疼的课程是什么呢?对大部分人来说,应该就是 高等数学了吧,比如 什么泰勒公式,微积分等,想想就让人头疼。接下来就是,but.最近FAIR(Facebook AI Research) 又暴雷了,他们使用神经网络训练了一个可以解微积分的model. 并且这个 模型相比之前的Matlab以及Maththematica快不少,并且准确率也高不少。这个model的准确率基本上是100%,比其...原创 2019-12-21 11:21:25 · 2396 阅读 · 0 评论 -
FB力挺的Pytorch深度学习 书本来了
获得 fb首席科学家力挺的 pytorch教程 发布啦,看截图整个 pdf一共141页,相对 其它教程来说 已经 相当精简了,先看一下目录结构因为这本书 主要是 利用pytorch,所以 作者单独将pytorch单独写了一张,据我前一段时间看的 数据统计 说 现在 学术界 超过 60%都在使用pytorch,tensorflow在工业界分量超过pytorch.好了,tf不过多说了,主要...原创 2019-11-22 14:10:38 · 1393 阅读 · 0 评论 -
facebook开源更快的NLP开发框架PyText
Open-sourcing PyText for faster NLP development方便大家阅读,从官网 粘下来了facebook刚开源PyText,官网访问https://code.fb.com/ai-research/pytext-open-source-nlp-framework/github:https://github.com/facebookresearch/py...原创 2018-12-15 16:25:25 · 1076 阅读 · 0 评论 -
tensorflow serving部署问题
最近在研究 tensorflow serving ,按照官方的demo尝试部署resnet模型,地址:https://medium.com/tensorflow/serving-ml-quickly-with-tensorflow-serving-and-docker-7df7094aa008docker 安装,resnet模型下载,启动容器均没有问题,唯独再跑 调用例子 resn...原创 2018-12-13 14:08:25 · 1125 阅读 · 0 评论 -
precision recall accuracy F1 说明
最近有些同学 问我一些 关于 precision recall 和 accuracy的问题,我觉得有必要在此处解释一下,以上图what-if中的混淆矩阵为例,矩阵第一行分别是tp,fn第二行分别是fp,tnprecision=tp/(tp+fp)recall=tp/(tp+fn)accuracy=(tp+tn)/allprecision和recall两个是负相关性,即preci...原创 2018-11-16 15:33:27 · 691 阅读 · 0 评论 -
win10安装mlflow过程中 更新protobuf报错
如题所示,mlflow的安装需要依赖protobuf,而我之前 安装tensorflow时,已经安装了protobuf3.5.2.今天 在安装mlflow时,在 更新protobuf(3.5.2---> 3.6.1)报错,如下:这个问题,google了一下,都是 说 修改 protobuf所在 文件夹的权限,但是 修改过了,还是 报 同样的错误。突然,想起来是不是 因...原创 2018-09-10 11:31:36 · 689 阅读 · 0 评论 -
python读取hdfs并返回dataframe
不多说,直接上代码from hdfs import Clientimport pandas as pdHDFSHOST = "http://xxx:50070"FILENAME = "/tmp/preprocess/part-00000" #hdfs文件路径COLUMNNAMES = [xx']def readHDFS():'''读取hdfs文件...原创 2018-09-03 15:56:24 · 7532 阅读 · 1 评论 -
python 读写hive
最近正在 做一个 项目,需要把 算法模型的结果持久化 至hive.目前 使用的 pyhive,切记 在windows上不能使用,我目前在centos6.5上使用,官方说再macos和linux上可用。from pyhive import hiveimport pandas as pd# from sqlalchemy import create_engine# from py...原创 2018-09-03 14:09:29 · 14246 阅读 · 2 评论 -
xgboost安装失败:Files/directories (from PKG-INFO) not found in C:\Users\WANGFA~1\AppData\Local\Temp\pip-
最近使用xgboost算法,但是 安装时遇到 以下错误:Files/directories (from PKG-INFO) not found in C:\Users\WANGFA~1\AppData\Local\Temp\pip-install-w0adajf1\xgboost\pip-egg-info安装方式: pip install xgboost从报错来看,应该是 缺少依赖,所...原创 2018-08-14 09:58:15 · 6351 阅读 · 1 评论 -
windows下将python模型保存为PMML文件
首先 需要 搞明白 一个 问题就是,为什么需要 将模型 保存为 pmml文件,以及 pmml文件是什么 东东。1. 什么 是pmml文件 predict model markup language 预测模型标记语言,它以xml格式保存,既然是 xml,那就是可以跨平台了啊。更详细的自行 google.2. 为什么要转换为pmml 我离线 训练了一个 模型,怎么 ...原创 2018-07-31 15:13:53 · 4148 阅读 · 0 评论 -
常用激活函数求导
知乎:https://zhuanlan.zhihu.com/albertwang微信公众号:AI-Research-Studio 下面是赞赏码原创 2018-07-27 15:28:01 · 6897 阅读 · 0 评论 -
Kmeans 优化
通过学习 李航 博士 的统计学习方法,知道了kd树 用于优化Kmeans算法,不经意间,看到了还有一种优化算法,叫 Ball tree,先将这两种算法的比较列举如下:Kd树: 依次对K维坐标轴,以中值切分构造的树,每一个节点都是一个超矩形,在维数小于20时,效率最高。 Balltree: 为了克服kd树高维失效而发明的,其构造过程是以质心C和半径R分割样本空间,每一个节点都是一...原创 2018-06-27 16:13:52 · 614 阅读 · 0 评论 -
聚类衡量指标
聚类常用衡量指标有 RI ARI MI NMI AMIRI :Rand index 兰德指数 取值[0,1] 值越大越好,表示聚类结果与真实情况越吻合ARI:adjusted RI:调整兰德系数 取值[-1,1]MI: mutual information based scores互信息 衡量两个数据分布(聚类)的吻合程度,[0,1]越大越好NMI: No...原创 2018-06-21 10:45:48 · 1196 阅读 · 0 评论 -
facebook的开源梯度优化工具Nevergrad
facebook的开源梯度优化工具github:https://github.com/facebookresearch/nevergrad官方原文地址:https://code.fb.com/ai-research/nevergrad/Nevergrad: An open source tool for derivative-free optimizationMost machin...原创 2018-12-21 09:55:02 · 1168 阅读 · 0 评论 -
神经网络的反向传播算法解释(back propagation)
最近好多同学在学习神经网络,而神经网络的核心应该就是BP算法了,好多同学对这块不太理解,在此,我就简单说一下。可以简单总结一句话:复合函数求偏导,请看下文详细解读:Forward propagation:Z1=W1*X0+B1A1=g(Z1)Z2=W2*A1+B2A2=g(Z2)…..Zn=Wn*An-1+BnAn=g(Zn)以上就是fp的整...原创 2018-12-27 20:49:42 · 812 阅读 · 0 评论 -
HMM解读
HMM的三个基本问题:Problem 1 (Likelihood): Given an HMM λ = (A,B) and an observation sequence O, determine the likelihood P(O|λ).Problem 2 (Decoding/Prediction): Given an observation sequence O a...原创 2018-12-11 19:17:18 · 603 阅读 · 0 评论 -
tensorflow feature_column详解
关于 feature_column官网说的 还比较少,其它说明 大多数 都是 直接 翻译 官网解释,很明显,达不到效果,现在 对feature_column进行说明,更详细的说明,可以参照github:https://github.com/AlbertBJ/tensorflow-summary此外,我还对 estimator进行了总结 以及 如何使用的 例子,github:https:...原创 2019-06-03 16:41:04 · 13399 阅读 · 0 评论 -
tensorflow estimator使用总结
最近在使用estimator做项目,发现 官网 对 这个 estimator整体的讲解 和使用 过程中的细节讲的比较少,结合 我是用过程中的问题,对 estimator的使用步骤进行了总结,如下:代码 见github,求star~~1. estimator主要需要model_fn,input_fn 以及 serving_fn2. model_fn主要是是用来定义model ,input_...原创 2019-05-24 15:12:38 · 7847 阅读 · 0 评论 -
ChineseNER based deep learning
上篇文章讲解 了tf.contrib.crf.crf_log_likelihood的使用,这边文章主要说一下 这个项目,详见github,求 Star~~,项目会不断更新注意 ,我这里使用的tensorflow版本是1.13.1.如果您使用 tensorflow2.0,contrib这个namespace已经不存在了,请注意里面用的 训练集 是 来源于https://bosonnlp.c...原创 2019-04-03 10:27:54 · 504 阅读 · 0 评论 -
tf.contrib.crf.crf_log_likelihood说明
最近在 做一个 NER的项目,使用的是BILSTM+CRF 结构,github,求star。现在 对 使用tf.contrib.crf.crf_log_likelihood时,遇到的参数问题 说一下:官方说明:https://www.tensorflow.org/code/stable/tensorflow/contrib/crf/python/ops/crf.pytf.contr...原创 2019-03-27 16:25:13 · 4297 阅读 · 0 评论 -
tensorflow Federated: 本地模型训练,无需上传训练数据
google 刚发布了 TFF 框架,全名是 TensorFlow Federated,它是干什么的呢,可以大概总结下:边缘设备(比如:手机)在本地 利用本地数据 训练模型,进而把 本地训练的模型参数 上传服务器,然后 服务器对 各个边缘设备 上传 的模型参数进行 聚合。为什么 需要这样做呢?目前大家 主要的 做法是 把 各种数据收集至 server,然后 利用 汇总的 数据进行模型...原创 2019-03-08 10:47:10 · 6885 阅读 · 1 评论 -
序列模型开发者的福音Lingvo: A TensorFlow Framework for Sequence Modeling
原文地址:https://medium.com/tensorflow/lingvo-a-tensorflow-framework-for-sequence-modeling-8b1d6ffba5bb?linkId=63952201github:https://github.com/tensorflow/lingvocolab:https://colab.research.google.co...原创 2019-02-25 10:07:46 · 667 阅读 · 0 评论 -
jupyter notebook 语言显示问题
这两天 更新 notebook至最新版 5.7.4,然而 发现 显示 出现 部分中文 部分英文的情况,如下图所示:之前已经习惯 使用 纯英文,突然出现 这种情况,总让人 感觉很不爽,刚开始 认为 可能是 安装 其他包的时候,对notebook设置进行了改动,故而首先 采取 uninstall 和install.然而 问题 还是 没有解决,看着 这个界面 好恶心呀,然后在 gith...原创 2019-02-13 20:30:47 · 11844 阅读 · 1 评论 -
win10 python spark ml(pyspark)安装
1. 安装python环境,自己google吧2. 安装jdk8, jdk-8u191-windows-x64.exe 如果本地安装的10,那么就请 切换至8,这点必须的。3. 安装pyspark4. 安装 Hadoop和 sparkspark-2.3.2-bin-hadoop2.6.tgzhadoop-2.6.4.tar.gz解压的时候,最好使用 管理员权限 ...原创 2019-01-22 19:38:16 · 1525 阅读 · 0 评论 -
Facebook AI 2018年终总结
干货满满,大家细读呀,原文链接:https://code.fb.com/ai-research/ai-2018/,文章中也有 一些 链接,是对 每个技术点的详解,自己想办法吧。有一些 在之前的博客中有提到,wav2letter++,pytextAI year in reviewAt Facebook, we think that artificial intelligence th...原创 2019-01-10 10:23:35 · 582 阅读 · 0 评论 -
tensorflow2.0 is coming
tensorflow 2.0 变化还是 蛮大的,特别是 变量创建还有就是tf.contrib 将会去除,还有 支持的语言更丰富了原文链接:https://medium.com/tensorflow/whats-coming-in-tensorflow-2-0-d3663832e9b8?linkId=62351082Thanks to an incredible and diverse ...原创 2019-01-15 09:55:11 · 874 阅读 · 0 评论 -
吴恩达 老师 机器学习资料
最近有同学问我要一些 机器学习 的 资料,现分享一下,有视频,编程题,开发下面是吴恩达 老师 的视频课程:https://pan.baidu.com/s/1EUWlqdUUneQwWMsN4C6dFQ或者 直接 上 https://www.coursera.org/ 上面也可以学习,目前这个课程是 免费的。建议按照coursera的视频看一遍(因为 线上 会对 ...原创 2019-01-04 10:16:18 · 631 阅读 · 0 评论 -
R-squared 和 Adjusted R-squared联系与区别
原文见:https://discuss.analyticsvidhya.com/t/difference-between-r-square-and-adjusted-r-square/264/8下面是自己理解的总结:大概意思就是说,R-squared(值范围0-1)描述的 输入变量对输出变量的解释程度。在单变量线性回归中R-squared 越大,说明拟合程度越好。然而只要曾加了...原创 2018-06-11 19:23:38 · 71404 阅读 · 3 评论 -
win10 安装 facets步骤
1. 安装 jupyter (不用多说)2. 安装facets pip install facets3. 安装 protobufpip install protobuf4. download facets 地址:https://github.com/PAIR-code/facets 直接用 git clonehttps://github.com/PAIR-code...原创 2018-05-28 19:38:40 · 2006 阅读 · 4 评论 -
斯坦福大学(吴恩达) 机器学习课后习题详解 第四周 神经网络表示
多看视频,多理解,都还挺简单的。知乎:https://zhuanlan.zhihu.com/albertwang微信公众号:AI-Research-Studio 下面是赞赏码原创 2018-03-13 14:29:54 · 2383 阅读 · 3 评论 -
斯坦福大学(吴恩达) 机器学习课后习题详解 第六周 编程题 正则化线性回归以及方差与偏差
作业下载地址:https://download.csdn.net/download/wwangfabei1989/103031341. 正则化线性回归代价函数 linearRegCostFunctionfunction [J, grad] = linearRegCostFunction(X, y, theta, lambda)%LINEARREGCOSTFUNCTION Compute cost ...原创 2018-03-22 20:54:35 · 1262 阅读 · 0 评论 -
斯坦福大学(吴恩达) 机器学习课后习题详解 第六周 机器学习系统设计
知乎:https://zhuanlan.zhihu.com/albertwang微信公众号:AI-Research-Studio 下面是赞赏码原创 2018-03-22 20:43:33 · 2105 阅读 · 0 评论 -
斯坦福大学(吴恩达) 机器学习课后习题详解 第六周 机器学习应用建议
知乎:https://zhuanlan.zhihu.com/albertwang微信公众号:AI-Research-Studio 下面是赞赏码原创 2018-03-22 17:43:23 · 1648 阅读 · 0 评论 -
斯坦福大学(吴恩达) 机器学习课后习题详解 第五周 编程题 神经网络
作业下载 地址:https://download.csdn.net/download/wwangfabei1989/103018021. sigmoid梯度计算function g = sigmoidGradient(z)%SIGMOIDGRADIENT returns the gradient of the sigmoid function%evaluated at z% g...原创 2018-03-22 17:08:06 · 4091 阅读 · 1 评论 -
斯坦福大学(吴恩达) 机器学习课后习题详解 第三周 编程题 逻辑回归
作业下载地址:https://download.csdn.net/download/wwangfabei1989/10267046压缩包中包含 习题以及习题指南1. 数据展示function plotData(X, y)%PLOTDATA Plots the data points X and y into a new figure% PLOTDATA(x,y) plots ...原创 2018-03-09 17:21:05 · 4391 阅读 · 0 评论 -
斯坦福大学(吴恩达) 机器学习课后习题详解 第三周 正则化
正则化测试题:知乎:https://zhuanlan.zhihu.com/albertwang微信公众号:AI-Research-Studio 下面是赞赏码原创 2018-03-09 17:09:34 · 3967 阅读 · 0 评论 -
斯坦福大学(吴恩达) 机器学习课后习题详解 第二周 编程题 线性回归
习题可以去这个地址下载http://download.csdn.net/download/wwangfabei1989/102654071. warmUpExercise.m的实现如下:function A = warmUpExercise()%WARMUPEXERCISE Example function in octave% A = WARMUPEXERCISE() is...原创 2018-03-01 17:48:49 · 4666 阅读 · 1 评论 -
斯坦福大学(吴恩达) 机器学习课后习题详解 第三周 逻辑回归
测试题 都比较简单,好好看视频吧知乎:https://zhuanlan.zhihu.com/albertwang微信公众号:AI-Research-Studio 下面是赞赏码原创 2018-03-08 16:31:52 · 4917 阅读 · 0 评论 -
斯坦福大学(吴恩达) 机器学习课后习题详解 第二周 多变量线性回归
多变量线性回归答案知乎:https://zhuanlan.zhihu.com/albertwang微信公众号:AI-Research-Studio 下面是赞赏码原创 2018-03-08 16:17:37 · 2123 阅读 · 0 评论 -
斯坦福大学(吴恩达) 机器学习课后习题详解 第二周 octave使用
这次测试,没什么 可讲解的,自己安装octave即可,然后按照题目,自己试一下就OK了。知乎:https://zhuanlan.zhihu.com/albertwang微信公众号:AI-Research-Studio 下面是赞赏码...原创 2018-02-08 15:38:28 · 2490 阅读 · 0 评论