可可~-CSDN博客

原创静态成员函数、静态成员变量相关知识整理

一. 静态成员变量的本质静态成员变量本质上是全局变量，哪怕一个对象都不存在，类的静态成员变量也存在。静态成员函数本质上是全局函数。二. 为什么要使用静态成员函数、成员变量节省内存静态成员是类的所有对象共享的，而不是某个对象的成员；对多个对象来说，静态数据成员只存储一处。节省时间静态数据成员的值对每个对象都...

2020-05-03 21:28:19 493

原创 LDC数据集获取、下载、购买

一. 简介很多数据集只能在LDC(Linguistic Data Consortium, https://www.ldc.upenn.edu/)获得，LDC语料库包括阿拉伯语、汉语和英语新闻文本、布朗语料库全文、来自交换机与费舍库（Fisher Collection）数以百万计的英语电话语音以及美国英语口语词汇。这里记录一下自己获取LDC的TACRED数据集遇到的一些问题。...

2020-01-06 16:21:50 10556 13

原创朴素贝叶斯法-算法实现

一. 概述1. 朴素贝叶斯：基于贝叶斯定理、特征条件独立假设的分类算法2. 实际上学习到生成数据的机制，属于生成模型二. 原理1. 估计先验概率、条件概率： a. 先验概率： b. 条件概率：朴素贝叶斯：条件独立的假设 ...

2019-08-30 21:49:55 560

原创 K近邻算法实现--KNN

一. KNN概述k-近邻（kNN, k-NearestNeighbor）算法是一种基本分类与回归方法，我们这里只讨论分类问题中的 k-近邻算法。k 近邻算法的输入为实例的特征向量，对应于特征空间的点；输出为实例的类别，可以取多类。k 近邻算法假设给定一个训练数据集，其中的实例类别已定。分类时，对新的实例，根据其 k 个最近邻的训练实例的类别，通过多数表决等方式进行预测。因此，k近邻算法不具...

2019-08-28 19:47:43 399

原创 Jupyter notebook配置虚拟环境、Anaconda管理虚拟环境

一：Anaconda管理虚拟环境1.查看已有的虚拟环境 conda env list2. 新建虚拟环境新建环境 conda create--name py3pytorchpython=3.7.3 执行之后会自动下载一些基本的包和Python3.7.3 创建好之后会在Anaconda3安装目录里的 /...

2019-08-12 11:54:45 2514 1

原创 python中的Collections库（Counter、namedtuple、OrderedDict）

一：namedtuple（） namedtuple是一个函数，它用来创建一个自定义的tuple对象，并且规定了tuple元素的个数，可以用属性而不是索引来引用tuple的某个元素。自定义一种数据类型，它具备tuple的不变性，又可以根据属性来引用，使用十分方便。创建的对象是tuple的一种子类import collections Circle =collections.namedt...

2019-08-09 21:15:55 463

原创 zip()函数、dict()函数、sorted()函数、互换字典中的keys与values、字典按value排序

dict() 函数可以将两个可迭代的对象，组合返回成一个元组数据。#zip（）函数示例a=["word1","word2","word3"]b = [1,2,3]print( list(zip(a,b)) )输出：>>> [('word1', 1), ('word2', 2), ('word3', 3)]若两个可迭代对象长短不一，依据最短一方确定...

2019-08-09 17:51:11 1721

转载数据降维可视化

参考：SNE、TSNE一：TSNE TSNE是由SNE衍生出的一种算法，SNE最早出现在2002年，它改变了MDS和ISOMAP中基于距离不变的思想，SNE将高维映射到低维的同时，尽量保证相互之间的分布概率不变，SNE将高维和低维中的样本分布都看作高斯分布，而Tsne将低维中的坐标当做T分布，这样做的好处是为了让距离大的簇之间距离拉大，从而解决了拥挤问题。从SNE到TSNE之间，...

2019-08-08 19:57:35 753

原创 word2vec-实现、代码解析笔记

看了很多关于word2vec的讲解文章，自己对代码略加改动和简化，有了更深的理解。使用的小数据集“text8”（点击链接下载）来训练skip-gram模型，主要用于理解思想和流程。Step 1: 加载数据数据集可直接载入内存，英文数据集已是空格隔开的单词不需考虑分词。import tensorflow as tfimport numpy as np...

2019-08-06 20:30:29 1755 1

原创如何查看tensor类型数据的值

我们在建立图（Graph）的时候，只定义 tensor 的结构形状信息，并没有执行数据的操作print函数只能打印输出tensor的shape信息，而不能直接显示tensor的值解决方法：方法一：在会话中print( sess.run(x) )import tensorflow as tf#定义tensor常量x = tf.random_uniform((2,...

2019-08-05 17:25:03 13198

原创 TensorFlow常见变量初始化

（1）X = tf.zeros(shape = [3,2], dtype=tf.float32, name=None) #初始化值为全0 (上述语句得到X为)： [ [0. 0.] [0. 0.] [0. 0.] ]（2）Y = tf.ones(shape =...

2019-08-05 16:52:53 1090

原创 TensorFlow中Graph和Session

TensorFlow中Graph和Session0. 变量与常量单元定义示例占位符相当于先占用内存中相应大小的单元，会话Session中计算时使用feed_dict传入数据train_labels = tf.placeholder ( tf.int32,shape = [batch_size, 1])常量`定义一个常量有着...

2019-08-05 15:53:42 385

原创阅读笔记--RippleNet: Propagating User Preferences on the Knowledge Graph for Recommender Systems

NLP笔记--RippleNet一：概述将KG作为推荐系统的辅助信息来源，利用实体关系三元组分析用户的偏好倾向并推理出哪些新的实体项可能是该用户可能喜欢的。其中知识图谱即KG指的是由类似（阿甘正传，电影-导演，罗伯特·泽米吉斯）的事实三元组构成，已...

2019-04-28 19:17:28 5384 3

C++面试整理.zip

看到的一个很不错的C++面试题整理；内容看着很不错；强迫症看着文档的排列也很舒适~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~···

2020-09-07

STL常见面试题.zip

C++中STL部分常见面试题~~~~~~~~~~~~~~~~·~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

2020-09-07

datingTestSet2.zip

海伦使用约会网站寻找约会对象。经过一段时间之后，她发现曾交往过三种类型的人: 不喜欢的人魅力一般的人极具魅力的人约会对象的数据存放在文本文件 datingTestSet2.txt 中，总共有 1000 行。海伦约会的对象主要包含以下 3 种特征：每年获得的飞行常客里程数玩视频游戏所耗时间百分比每周消费的冰淇淋公升数所有数据均均有唯一标签

2019-08-28

text8_word2vec训练数据集

word2vec常用训练数据集，text8数据集，解压后放入程序文件夹下，即可在程序中直接载入。

2019-08-06

全栈数据之门 , 任柳江 pdf 高清带目录扫描版<br/><br/>《全栈数据之门》以数据分析领域最热的Python语言为主要线索，介绍了数据分析库numpy、Pandas与机器学习库scikit-learn，使用了可视化环境Orange 3来理解算法的一些细节。对于机器学习，既有常用算法kNN与Kmeans的应用，决策树与随机森林的实战，还涉及常用特征工程与深度学习中的自动编程器。在大数据Hadoop与Hive环境的基础之上，使用Spark的ML/MLlib库集成了前面的各部分内容，让分布式机器学习更容易。大量的工具与技能实战的介绍将各部分融合成一个全栈的数据科学内容。, 《全栈数据之门》不是从入门到精通地介绍某一种技术，可以把《全栈数据之门》当成一本技术文集，内容定位于数据科学的全栈基础入门，全部内容来自当前业界最实用的技能，有非常基础的，也有比较深入的，有些甚至需要深入领悟才能理解。, 《全栈数据之门》适用于任何想在数据领域有所作为的人，包括学生、爱好者、在职人员与科研工作者。无论想从事数据分析、数据工程、数据挖掘或者机器学习，或许都能在书中找到一些之前没

2018-05-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人