课程笔记
文章平均质量分 83
shanesu
资深人力资源产品经理,精通VBA编程,热爱机器学习
展开
-
reinforce learning课程笔记
一、Crossentropy method场景1:平衡游戏问题:已知在一组status下,进行对应一组action时,最终的reward。解决方案1:创建一个初始的policy表,表示每一个status下选择某一个action的概率 找1000组status,根据policy表,得到对应的action组; 根据status:action组,带入模型场景,得到对应的reward...原创 2021-08-16 20:28:55 · 520 阅读 · 0 评论 -
区块链基础
基本定义1、transaction:交易,由多个UTXO输入、多个UTXO输出组成2、UTXO:unspent transaction output3、block:区块,由head、多个transaction组成4、blockchain:区块链,block根据协议形成区块链5、旷工Miners:take on added work or computation to ve...原创 2021-08-16 20:26:53 · 195 阅读 · 0 评论 -
【RPA】UIpath Academy BA篇
一、流程介绍1、What is a Process流程是什么Definition: A set of interrelated or interacting activities that transforms inputs into outputs •Components: Inputs, Process Flows, Source Applications and Outputs ...原创 2019-12-09 21:55:09 · 1647 阅读 · 0 评论 -
【RPA】UIpath Academy
一、引导篇1、企业标准化流程:Inputs- the data that goes in the process; Process Flows- the sequences of sub-processes or activities undertaken in the process; Source Applications- the applications or syst...原创 2019-10-30 02:04:41 · 5253 阅读 · 0 评论 -
双层stack模型的train、validation分割策略
There are a number of ways to validate second level models (meta-models). In this reading material you will find a description for the most popular ones. If not specified, we assume that the data does...转载 2018-04-01 22:11:47 · 529 阅读 · 0 评论 -
Ensembling模型融合
>>本文所有内容整理自Coursera - Advanced Machine Learning-How to Win a Data Science Competition: Learn from Top KagglersAdvanced Machine Learning一、average最基础的,将不同模型的结果平均(或加权平均),得到最终的估计二、bagging概念:相同模型不同参数...原创 2018-04-01 23:48:18 · 3926 阅读 · 0 评论 -
完成一个kaggle竞赛
本文所有内容整理自Coursera - Advanced Machine Learning- How to Win a Data Science Competition: Learn from Top Kagglers一、分析问题1、问题类型: 2、数据量大小 3、硬件需要 4、软件需要 5、评估模型是什么 6、有没有一些相关的历史代码二、探索性数据分析基本操作1、通过hist图查原创 2018-04-03 23:56:23 · 1960 阅读 · 1 评论 -
评价模型metircs optimization指南
本文所有内容整理自Coursera - Advanced Machine Learning- How to Win a Data Science Competition: Learn from Top Kagglers定义evaluation metrics基本概念一般来说,优化矩阵由组织者按照业务需求定义有些情况下,优化目标不太好量化,需要直觉判断转换为其他优化矩阵观察优化矩阵优化的趋势是原创 2018-04-06 20:53:54 · 718 阅读 · 0 评论 -
贝叶斯网络(1)- 基础概念
本文内容主要总结自coursera课程Bayesian Methods for Machine Learning一、什么是贝叶斯概率有一个问题,我们有一个硬币,怎么判断这个硬币投掷后,显示正面的概率呢?频率学派:我们可以投掷这个硬币100次,看有多少次是正面,这个结果应该趋近于硬币投掷正面的概率。贝叶斯学派:从生活经验上,硬币投掷到正面的概率是50%,那么我们对于显示正面的...原创 2018-05-05 23:58:56 · 2776 阅读 · 0 评论 -
贝叶斯网络(2)- EM协同计算
本文内容主要总结自coursera课程Bayesian Methods for Machine Learning 本文内容延续自《贝叶斯网络(1)- 基础概念》 https://blog.csdn.net/qq_36080693/article/details/80160852一、基础知识1、Expectation Maximization鸡和蛋问题...原创 2018-05-06 03:17:17 · 1582 阅读 · 0 评论 -
贝叶斯网络(3) - 变分推断(variational inference)
一、问题在最初的计算中,我们默认先验分布和后验分布同分布(共轭分布)。但在实际中,后验分布并不一定符合某一个分布。 例如,likelihood是一个神经网络,和先验的计算结果就不是一个标准的共轭分布 这时候,我们就要找到一个分布可以无限逼近后验分布 二、Mean field计算方法1、我们假设后验分布是多个q(z)的乘积结果 2、而这边的q(z)属于一个特定的分布范围3、我们的目标是确保每一原创 2018-05-06 16:27:56 · 4581 阅读 · 0 评论 -
贝叶斯神经网络(5)- 图像处理bayes-CNN
一、无偏估计百度:无偏估计是用样本统计量来估计总体参数时的一种无偏推断。估计量的数学期望等于被估计参数的真实值,则称此此估计量为被估计参数的无偏估计,即具有无偏性,是一种用于评价估计量优良性的准则。无偏估计的意义是:在多次重复下,它们的平均数接近所估计的参数真值。无偏估计常被应用于测验分数统计中。二、计算图片的组成分布p(x)用途:如果我们知道的图片的分布p(x),我们就可以生成新的图片,判断异常...原创 2018-06-03 20:53:33 · 10950 阅读 · 1 评论 -
Bayes方案和传统机器学习方法
以身高、体重的线性关系为例身高体重17077165651556017885x:身高 y:体重 y = ax+b1、传统机器学习方法参数a、b是一个确定的值,通过拟合线性方程,我们可以根据数据集得到一个确定的a和b值得到a和b值后,如果我们得到一个新的身高 190,就可以通过公式计算出体重(1.1367*190-118)2、贝叶斯方法参数a、b并不是一个确定的值,而是属于某一个概率分布。为什...原创 2018-05-28 23:07:41 · 1125 阅读 · 1 评论 -
Coursera Big Data系列课程笔记2
hadoop Cloudera virtual machine 操作week18 spark data preparation for MLpyspark #启动网页窗口 Downloads/big-data-4/handling-missing-values.ipynb[1] from pyspark.sql import SQLContext ##加载SQLContextsqlContext原创 2017-01-16 00:16:53 · 852 阅读 · 0 评论 -
Coursera Big Data系列课程笔记1
hadoop Cloudera virtual machine 操作http://github.com/words-sdsc/coursera big-data-1:安装方式在Introduction to big data课程第一周 big-data-2:安装方式在Big Data Modeling and Management课程第一周 big-data-3:安装方式在Big Data I原创 2017-01-03 22:30:10 · 2624 阅读 · 0 评论 -
R Clustering & Dimension Reduction聚类和降维
约翰霍普金斯大学Data Science系列专项课程Exploratory Data Analysis的学习笔记原创 2016-10-05 00:23:21 · 1060 阅读 · 0 评论 -
R Markdown简单指南
Markdown Markdown is a text-to-HTML conversion tool for web writers. 这也是Markdown最实用的功能。但实际上,Markdown作为一种标记语言,可以让编写内容的作者更专注于内容本身。 利用简单的标记,制作出美观的,出版级的内容。Markdown的应用非常广泛,市面上很多博客也采取了这种技术。 Markdown可生成原创 2016-10-11 21:36:39 · 36116 阅读 · 0 评论 -
R color颜色
约翰霍普金斯大学Data Science系列专项课程Exploratory Data Analysis的学习笔记原创 2016-10-04 13:35:27 · 2158 阅读 · 0 评论 -
R ggplot2
约翰霍普金斯大学Data Science系列专项课程Exploratory Data Analysis的学习笔记原创 2016-10-04 13:34:23 · 506 阅读 · 0 评论 -
R ggplot2之qplot
约翰霍普金斯大学Data Science系列专项课程Exploratory Data Analysis的学习笔记原创 2016-09-17 18:51:40 · 513 阅读 · 0 评论 -
R lattice作图基本知识
约翰霍普金斯大学Data Science系列专项课程Exploratory Data Analysis的学习笔记原创 2016-09-17 18:43:56 · 1968 阅读 · 0 评论 -
R Exploratory Data Analysis探索性数据分析基础部分
约翰霍普金斯大学Data Science专项课程的学习笔记原创 2016-09-08 02:00:38 · 1489 阅读 · 0 评论 -
R Getting and Cleaning Data获取和清理数据
—————————-基础包————————————— unique() 去重 n() 数量 n_distinct() 去重数量 quantile() 百分比对应条件值 url() readlines() close() nchar() 统计每行数量table(data$zip %in% c(“1”,”2”)) 可增加多个匹配条件 a[which()] 可去除NAdownl原创 2016-09-07 23:39:08 · 1389 阅读 · 0 评论 -
Reproducible可重复性 研究论文必备属性
一篇好的研究论文需要具备可重复性,只有结果是没有意义的。你需要告诉别人,怎么按图索布才能得到你的分析结果。 - 其他研究者可以检验你的结果和过程是否严密科学 - 其他研究者可以在你的研究基础上,在某些环节进行扩展性研究 - 其他研究者可以了解你整个分析的脉络,更好的理解内容以下内容是整理自coursera的Reproducible Research 课程的内容总结一篇Reproducibl转载 2016-11-02 23:54:13 · 703 阅读 · 0 评论 -
R Reproducible Research course project课程练习
原版Rmd代码在这个github地址title: “Reproducible Research: Peer Assessment 1” author: “shanesu” date: “2016年10月12日” output: html_document: keep_md: trueIntroductionThis assignment makes use of data原创 2016-10-13 22:48:57 · 687 阅读 · 0 评论 -
简谈各类数据库和查询语法
以下理解可能有一些错误,见谅数据库简介mongoDBNoSql非关系数据库操作上:支持正则模糊查询支持数组查询操作支持多级嵌套查询使用aggregate进行层次化的逐级函数查询某老外的点评 The reason we choose mongodb was because of its semistructured document support (json) and its cap原创 2016-10-15 00:21:12 · 486 阅读 · 0 评论 -
Coursera 零基础Python入门系列课程习题解答
Chapter7 开始的答案,兹以广大网友参考原创 2016-12-29 22:37:13 · 12392 阅读 · 1 评论 -
hadoop 下载安装Cloudera Virtual Machine (VM)
1. Install VirtualBox. Go to https://www.virtualbox.org/wiki/Downloads to download and install VirtualBox for your computer. For Windows, select the link "VirtualBox 5.1.4 for Windows hosts x86/amd6转载 2016-09-09 00:37:51 · 2602 阅读 · 0 评论