自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 资源 (5)
  • 收藏
  • 关注

原创 静态成员函数、静态成员变量 相关知识整理

一. 静态成员变量的本质静态成员变量本质上是全局变量,哪怕一个对象都不存在,类的静态成员变量也存在。 静态成员函数本质上是全局函数。二. 为什么要使用 静态成员函数、成员变量 节省内存 静态成员是类的所有对象共享的,而不是某个对象的成员;对多个对象来说,静态数据成员只存储一处。 节省时间 静态数据成员的值对每个对象都...

2020-05-03 21:28:19 466

原创 LDC数据集获取、下载、购买

一. 简介 很多数据集只能在LDC(Linguistic Data Consortium, https://www.ldc.upenn.edu/)获得,LDC语料库包括阿拉伯语、汉语和英语新闻文本、布朗语料库全文、来自交换机与费舍库(Fisher Collection)数以百万计的英语电话语音以及美国英语口语词汇。这里记录一下自己获取LDC的TACRED数据集遇到的一些问题。...

2020-01-06 16:21:50 10181 13

原创 朴素贝叶斯法-算法实现

一. 概述1. 朴素贝叶斯:基于贝叶斯定理、特征条件独立假设的 分类算法2. 实际上学习到生成数据的机制,属于生成模型二. 原理1. 估计先验概率、条件概率: a. 先验概率: b. 条件概率: 朴素贝叶斯:条件独立的假设 ...

2019-08-30 21:49:55 527

原创 K近邻算法实现--KNN

一. KNN概述k-近邻(kNN, k-NearestNeighbor)算法是一种基本分类与回归方法,我们这里只讨论分类问题中的 k-近邻算法。k 近邻算法的输入为实例的特征向量,对应于特征空间的点;输出为实例的类别,可以取多类。k 近邻算法假设给定一个训练数据集,其中的实例类别已定。分类时,对新的实例,根据其 k 个最近邻的训练实例的类别,通过多数表决等方式进行预测。因此,k近邻算法不具...

2019-08-28 19:47:43 365

原创 Jupyter notebook配置虚拟环境、Anaconda管理虚拟环境

一:Anaconda管理虚拟环境1.查看已有的虚拟环境 conda env list2. 新建虚拟环境新建环境 conda create--name py3pytorchpython=3.7.3 执行之后会自动下载一些基本的包和Python3.7.3 创建好之后会在Anaconda3安装目录里的 /...

2019-08-12 11:54:45 2412 1

原创 python中的Collections库(Counter、namedtuple、OrderedDict)

一:namedtuple() namedtuple是一个函数,它用来创建一个自定义的tuple对象,并且规定了tuple元素的个数,可以用属性而不是索引来引用tuple的某个元素。自定义一种数据类型,它具备tuple的不变性,又可以根据属性来引用,使用十分方便。创建的对象是tuple的一种子类import collections Circle =collections.namedt...

2019-08-09 21:15:55 431

原创 zip()函数、dict()函数、sorted()函数、互换字典中的keys与values、字典按value排序

dict() 函数可以将两个可迭代的对象,组合返回成一个元组数据。#zip()函数示例a=["word1","word2","word3"]b = [1,2,3]print( list(zip(a,b)) )输出:>>> [('word1', 1), ('word2', 2), ('word3', 3)]若两个可迭代对象长短不一,依据最短一方确定...

2019-08-09 17:51:11 1687

转载 数据降维可视化

参考:SNE、TSNE一:TSNE TSNE是由SNE衍生出的一种算法,SNE最早出现在2002年,它改变了MDS和ISOMAP中基于距离不变的思想,SNE将高维映射到低维的同时,尽量保证相互之间的分布概率不变,SNE将高维和低维中的样本分布都看作高斯分布,而Tsne将低维中的坐标当做T分布,这样做的好处是为了让距离大的簇之间距离拉大,从而解决了拥挤问题。从SNE到TSNE之间,...

2019-08-08 19:57:35 726

原创 word2vec-实现、代码解析笔记

看了很多关于word2vec的讲解文章,自己对代码略加改动和简化,有了更深的理解。使用的小数据集“text8”(点击链接下载)来训练skip-gram模型,主要用于理解思想和流程。Step 1: 加载数据 数据集可直接载入内存,英文数据集已是空格隔开的单词不需考虑分词。import tensorflow as tfimport numpy as np...

2019-08-06 20:30:29 1723 1

原创 如何查看tensor类型数据的值

我们在建立图(Graph)的时候,只定义 tensor 的结构形状信息 ,并没有执行数据的操作print函数 只能打印输出tensor的shape信息,而不能直接显示tensor的值解决方法: 方法一:在会话中print( sess.run(x) )import tensorflow as tf#定义tensor常量x = tf.random_uniform((2,...

2019-08-05 17:25:03 13139

原创 TensorFlow常见变量初始化

(1)X = tf.zeros(shape = [3,2], dtype=tf.float32, name=None) #初始化值为全0 (上述语句得到X为): [ [0. 0.] [0. 0.] [0. 0.] ](2)Y = tf.ones(shape =...

2019-08-05 16:52:53 1072

原创 TensorFlow中Graph和Session

TensorFlow中Graph和Session0. 变量与常量单元定义示例占位符相当于先占用内存中相应大小的单元,会话Session中计算时使用feed_dict传入数据train_labels = tf.placeholder ( tf.int32,shape = [batch_size, 1])常量`定义一个常量有着...

2019-08-05 15:53:42 352

原创 阅读笔记--RippleNet: Propagating User Preferences on the Knowledge Graph for Recommender Systems

NLP笔记--RippleNet一:概述 将KG作为推荐系统的辅助信息来源,利用实体关系三元组分析用户的偏好倾向并推理出哪些新的实体项可能是该用户可能喜欢的。其中知识图谱即KG指的是由类似(阿甘正传,电影-导演,罗伯特·泽米吉斯)的事实三元组构成,已...

2019-04-28 19:17:28 5347 3

C++面试整理.zip

看到的一个很不错的C++面试题整理;内容看着很不错;强迫症看着文档的排列也很舒适~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~···

2020-09-07

STL常见面试题.zip

C++中STL部分常见面试题~~~~~~~~~~~~~~~~·~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

2020-09-07

datingTestSet2.zip

海伦使用约会网站寻找约会对象。经过一段时间之后,她发现曾交往过三种类型的人: 不喜欢的人 魅力一般的人 极具魅力的人 约会对象的数据存放在文本文件 datingTestSet2.txt 中,总共有 1000 行。海伦约会的对象主要包含以下 3 种特征: 每年获得的飞行常客里程数 玩视频游戏所耗时间百分比 每周消费的冰淇淋公升数 所有数据均均有唯一标签

2019-08-28

text8_word2vec训练数据集

word2vec常用训练数据集,text8数据集,解压后放入程序文件夹下,即可在程序中直接载入。

2019-08-06

全栈数据之门 , 任柳江 pdf

全栈数据之门 , 任柳江 pdf 高清 带目录 扫描版<br/><br/>《全栈数据之门》以数据分析领域最热的Python语言为主要线索,介绍了数据分析库numpy、Pandas与机器学习库scikit-learn,使用了可视化环境Orange 3来理解算法的一些细节。对于机器学习,既有常用算法kNN与Kmeans的应用,决策树与随机森林的实战,还涉及常用特征工程与深度学习中的自动编程器。在大数据Hadoop与Hive环境的基础之上,使用Spark的ML/MLlib库集成了前面的各部分内容,让分布式机器学习更容易。大量的工具与技能实战的介绍将各部分融合成一个全栈的数据科学内容。, 《全栈数据之门》不是从入门到精通地介绍某一种技术,可以把《全栈数据之门》当成一本技术文集,内容定位于数据科学的全栈基础入门,全部内容来自当前业界最实用的技能,有非常基础的,也有比较深入的,有些甚至需要深入领悟才能理解。, 《全栈数据之门》适用于任何想在数据领域有所作为的人,包括学生、爱好者、在职人员与科研工作者。无论想从事数据分析、数据工程、数据挖掘或者机器学习,或许都能在书中找到一些之前没

2018-05-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除