机器学习基础
文章平均质量分 65
涵星同学
Just write down in here.
展开
-
ANTLR实践
“除草帖。翻到了几年前做的一个语言解析的小项目,感觉笔记躺在自己笔记本里挺浪费,放在博客上或许还能体现点价值”。原创 2022-04-20 13:05:27 · 577 阅读 · 0 评论 -
策略产品函数方法论——评估
在机器学习常用性能指标及sklearn中的模型评估一文中已对相对宏观的模型评价指标进行了描述,并给出了在sklearn中具体的实现方法,主要包括准确率、精确率、召回率,ROC曲线,那在策略产品工作中,如何进行业务函数的评估?1. 评估前的样本切分...原创 2021-03-22 21:46:05 · 341 阅读 · 0 评论 -
输出单元——sigmoid单元&softmax单元
1. 用于高斯输出分布的线性单元给定特征h,线性输出单元层产生一个向量 y = wh + b.线性输出层不会饱和,故易采用基于梯度的优化算法。2. 用于伯努利输出分布的sigmoid单元神经网络仅需要预测P(y=1|x),为了使这个数是一个有效的概率,它必须处在区间[0,1]中。假设使用线性单元,并通过阈值来限制它成为一个有效的概率:P(y=1|x) = max{0,min{1,wh + b}}....原创 2018-03-05 14:42:22 · 4465 阅读 · 0 评论 -
常用文本相似度计算方法
在此记录两种常见的文本相似度计算方式:基于VSM论文和基于LDA论文;这两种方式的不同在于文本表示的不同,LDA与VSM相比,增加了概率的信息,更侧重对语义的挖掘。在进行文本建模之后,计算相似度的常用距离有:余弦距离,欧式距离,曼哈顿距离,切比雪夫距离,simhash+汉明距离...详见...原创 2018-04-08 22:01:38 · 2713 阅读 · 0 评论 -
Neo4j(一)
Neo4j是世界排名第一的图数据库,在社交、零售、金融、征信、IT管理等各个领域有着广泛的应用前景。领英用Neo4j实现了社交关系管理及朋友推荐,沃尔玛用Neo4j实现了零售商品实施推荐。介绍来自这里,对其中内容稍作修改和补充:Neo4j安装官网可直接下载https://neo4j.com/download/安装结束后先登录,创建Database,然后在浏览器中访问http://localhost...原创 2018-04-25 18:28:03 · 583 阅读 · 0 评论 -
机器学习常用性能指标及sklearn中的模型评估
一,机器学习常用性能指标总结(转载并稍作修改和补充)在机器学习中,性能指标(Metrics)是衡量一个模型好坏的关键,通过衡量模型输出y_predict 和 y_true之间的某种"距离"得出的。性能指标往往是我们做模型时的最终目标,如准确率,召回率,敏感度等等,但是性能指标常常因为不可微分,无法作为优化的loss函数,因此采用如cross-entropy, rmse等“距离”可微函数...转载 2018-09-17 12:08:00 · 17920 阅读 · 3 评论 -
损失函数 loss function 总结(转)
目标函数,或称损失函数,是网络中的性能函数,也是编译一个模型必须的两个参数之一。由于损失函数种类众多,下面以keras官网手册的为例。在官方keras.io里面,有如下资料: mean_squared_error或mse mean_absolute_error或mae mean_absolute_percentage_error或mape mean_squa...转载 2018-09-26 11:06:14 · 4261 阅读 · 1 评论 -
sklearn: OneVsRestClassifier实现多分类 + Grid_Search获取模型的最佳参数
一,sklearn分类器单一分类器 & 集成分类器 https://www.cnblogs.com/hhh5460/p/5132203.html使用sklearn https://www.jianshu.com/p/516f009c0875sklearn通过OneVsRestClassifier实现svm.SVC的多分类 https://blog.csdn.net/xiaodo...原创 2018-09-26 11:27:18 · 12958 阅读 · 0 评论 -
用sklearn进行特征提取及数值转换
对自己目前常用的几种特征提取方法做个简要总结。1,将文本数据转化为特征向量(其中CountVectorizer只考虑词汇在文本中出现的频率)from sklearn.feature_extraction.text import CountVectorizerfrom sklearn.feature_extraction.text import TfidfTransformerwor...原创 2019-01-10 22:40:27 · 2473 阅读 · 0 评论