![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
笔记
weixin_42663919
这个作者很懒,什么都没留下…
展开
-
文本相似度
文本相似度方法分类参考https://blog.csdn.net/qq_28031525/article/details/79596376基于关键词匹配基于向量空间基于深度学习基于关键词匹配jaccard相似度https://zhuanlan.zhihu.com/p/101277851TF-IDFhttps://zhuanlan.zhihu.com/p/113017752BM25原理:https://blog.csdn.net/qq_28031525/article/d原创 2021-07-11 18:01:29 · 108 阅读 · 0 评论 -
word2vec记录
word2vec记录skip-gram和cbow原理https://www.cnblogs.com/pinard/p/7243513.htmlhttps://zhuanlan.zhihu.com/p/35074402层次softmax代码https://github.com/BUAAQingYuan/fasttext/blob/master/huffman_tree.py转移概率计算https://spaces.ac.cn/archives/4368层次softmax法1:import n原创 2021-05-05 19:37:10 · 195 阅读 · 0 评论 -
关键词指标
关键词指标precision,recall,F1????????????????????????????????????=????????/(????????+????????)????????????????????????=????????/(????????+????????)F1=(2∗????????????????????????????????????∗????????????????????????)/(????????????????????????????????????+?转载 2021-03-01 20:13:50 · 236 阅读 · 0 评论 -
2021-01-08
强化学习经典模型学习- githubhttps://github.com/Qunima1120/Reinforcement-learning-with-tensorflow/tree/master/contents- 论文链接:https://pan.baidu.com/s/1NbDtQ4YcENxFqetqj0hXKw提取码:il50原创 2021-01-08 14:45:01 · 69 阅读 · 1 评论 -
Self attention-Multihead attention-Transformer
Self attention-Multihead attention-Transformerhttps://mp.weixin.qq.com/s?__biz=MzI1MzY0MzE4Mg==&mid=2247488161&idx=1&sn=cf0f5e1a443c50eea19d134bb8428901&chksm=e9d00260dea78b7648a82c41fcb5ab8e9ba97f4a7388b93323fbb65d68596184df3d04933cee&原创 2020-11-17 10:48:30 · 171 阅读 · 0 评论 -
线性回归对样本的要求
线性回归线性回归本身对残差的假定有:0均值正态分布,对自变量假定:自变量和响应变量之间的相关关系为线性关系https://mp.weixin.qq.com/s?src=11×tamp=1605240424&ver=2703&signature=7fE0CgJnzzpEbQfUNlZmZx5dF4JXtiXPWhFU3A*RvBkXs0Fgbv5bbsYRFiqLG-Ex6kexOasvH5Hu9rgnAnO1cQp3CbJCKUbnGl0mqoxjp1OUWiAVc原创 2020-11-13 12:49:01 · 2980 阅读 · 0 评论 -
异常点检测
异常点检测kmeanshttps://blog.csdn.net/weixin_42608414/article/details/89092501LOFhttps://blog.csdn.net/wangyibo0201/article/details/51705966DBSCANhttps://blog.csdn.net/qingqing7/article/details/79719382‘’三种方法都可以sklearn实现:https://blog.csdn.net/jianbinzh原创 2020-10-26 11:36:55 · 119 阅读 · 0 评论 -
PCA,因子分析笔记
PCA,因子分析笔记PCA推导https://blog.csdn.net/zhongkelee/article/details/44064401几何意义https://www.cnblogs.com/frombeijingwithlove/p/5931872.html旋转矩阵https://www.cnblogs.com/chenjieyouge/p/12364589.html因子分析简单理解https://blog.csdn.net/yujianmin1990/article/d原创 2020-10-26 11:31:02 · 165 阅读 · 0 评论 -
数据分析记录
记录数据分析套路1、数据清洗2、特征选择根据缺失筛选变量(注意变量相关性和样本量之间的平衡,当某关键变量缺失过多,可以通过丢弃样本尽量保留变量)根据统计分析筛选变量引用 early Recognition of Burn- and trauma-Related Acute Kidney injury: A pilot comparison of Machine Learning techniquesThe Shapiro-Wilkes test and histogram ana原创 2020-09-30 09:47:03 · 265 阅读 · 0 评论 -
记录Multivariate adaptive regression splines
多变量自适应回归样条,Multivariate adaptive regression splines介绍见https://esl.hohoweiya.xyz/09-Additive-Models-Trees-and-Related-Methods/9.4-MARS/index.html该算法用于回归,分类(对y每一个类别拟合一次模型,若有k个类别,则设置:yi=0/1,i=1~k)该算法由特征取值的分段函数与分段函数的乘积的加权和和组成,原理上类似CART刚开始接触你,以后再补充~,..原创 2020-09-24 17:47:00 · 978 阅读 · 0 评论 -
格兰杰因果检验
格兰杰因果检验概念https://blog.csdn.net/Luciazxx/article/details/44224145?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522159903498619724843336308%2522%252C%2522scm%2522%253A%252220140713.130102334…%2522%257D&request_id=159903498619724843336308&原创 2020-09-02 17:23:47 · 626 阅读 · 0 评论 -
统计检验笔记
统计检验笔记显著性检验可以分为参数检验和非参数检验。参数检验要求样本来源于正态总体(服从正态分布),且这些正态总体拥有相同的方差,在这样的基本假定(正态性假定和方差齐性假定)下检验各总体均值是否相等,属于参数检验。当数据不满足正态性和方差齐性假定时,参数检验可能会给出错误的答案,此时应采用基于秩的非参数检验。单样本t检验指的是 某类样本跟某个均值的对比 比如大一新生身高 跟往年均值的差异https://www.cnblogs.com/qiuyuyu/p/9630410.html独立样本T检验原创 2020-08-29 10:41:22 · 2592 阅读 · 0 评论 -
Deep Belief network笔记
参考https://blog.csdn.net/Rainbow0210/article/details/53010694?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.channel_param&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.cha原创 2020-08-24 15:23:25 · 272 阅读 · 0 评论 -
tensorflow学习
tensorflow学习博客https://blog.csdn.net/jiaoyangwm/article/details/79715826https://blog.csdn.net/jiaoyangwm/article/details/79725445https://blog.csdn.net/qq_38412868/article/details/83748553书《Tensorflow 实战Google深度学习框架》《TensorFlow实战_黄文坚》链接:https://pan.b原创 2020-08-24 13:57:13 · 79 阅读 · 0 评论 -
转载一个特征提取的方法——AE
转载https://blog.csdn.net/jiaoyangwm/article/details/79725445原理代码import tensorflow as tfimport matplotlib.pyplot as pltfrom tensorflow.examples.tutorials.mnist import input_datamnist = input_data.read_data_sets("MNIST_data/", one_hot=False)learning转载 2020-08-04 09:31:25 · 757 阅读 · 0 评论 -
解决热力图坐标轴文字保存显示不全,数字越界显示不全,刻度条负号显示为框的问题
import numpy as npimport pandas as pddata = pd.read_excel("528全部清洗数据.xlsx",sheet_name="Sheet1",header=0,encoding="utf-8")data=data.iloc[:,1:]import seaborn as snsimport matplotlib.pyplot as plttitlea=["检验结果评定","检疫结果评定","集装箱检疫结果","货物评定","检验检疫结果代码","索原创 2020-06-05 11:08:47 · 6888 阅读 · 2 评论 -
实体识别——识别交通工具、伴随人员、目标地点
实体识别——识别交通工具、伴随人员、目标地点‘哈工大LTP对实体识别还属于初学时期,稍微做做记录。一开始使用的是哈工大训练好的模型LTP。LTP功能很多,能做分词,词性标注,命名实体识别(人名,地名,机构名),依存句法分析,语义角色标注。参考网址1参考网址2在安装过程,要先“$ pip install pyltp”,再下载训练好的pyltp的模型,详细见以上两个网址。在“$ pip i...原创 2020-03-15 15:33:08 · 482 阅读 · 0 评论 -
SVD
https://www.cnblogs.com/pinard/p/6251584.html原创 2020-02-29 15:05:07 · 88 阅读 · 0 评论