人工智能, 调bug
z2539329562
这个作者很懒,什么都没留下…
展开
-
dataset.padded_batch 用法案例
import tensorflow as tfimport numpy as nptf.reset_default_graph()x = [[1, 0, 0], [2, 3, 0], [4, 5, 6], [7, 8, 0], [9, 0, 0], [0, 1, 0]]x_new = [np.array(i) for i in x]...原创 2019-05-03 21:42:32 · 6454 阅读 · 0 评论 -
tf.data.Dataset读取数据的几种方式案例
读取方式1:一次性将序列读入计算图中。import tensorflow as tfimport numpy as npx = {"a": [i for i in range(5)], "b": np.random.uniform(size=(5, 2))}#创建dataset,里面包含 5个元素,分别为# {'a': 0, 'b': array([0.31102...原创 2019-05-04 10:31:21 · 6562 阅读 · 1 评论 -
神经网络基础--只有一层隐藏层的神经网络实现
代码来源是 :https://github.com/1601120453/cs224n-homework/blob/master/assignment1/q2_neural.pyimport numpy as npimport randomfrom q1_softmax import softmaxfrom q2_sigmoid import sigmoid, sigmoid_g...原创 2019-05-19 01:37:42 · 2047 阅读 · 0 评论 -
tf.nn.nce_loss 函数应用案例
tf.nn.nce_loss( weights, biases, labels, inputs, num_sampled, num_classes, num_true=1, sampled_values=None, remove_accidental_hits=False, partition_strategy='m...原创 2019-05-21 16:55:17 · 2606 阅读 · 0 评论 -
softmax求导--参照cs224n作业
原创 2019-05-16 20:44:34 · 330 阅读 · 0 评论 -
tf.nn.dynamic_rnn应用案例及RNN中数据填充sequence_length的理解
本文代码来自于其他人的博客:import tensorflow as tfimport numpy as nptf.reset_default_graph() x = np.random.randn(2,3, 4)x[1, 2:] = 0x_length = [3, 2]cell = tf.nn.rnn_cell.LSTMCell(num_units=2, state_is...原创 2019-05-03 21:08:52 · 3149 阅读 · 0 评论 -
分词算法--正向最大匹配和逆向最大匹配实现
本代码来源于《python自然语言处理实战 核心技术与算法》一书中逆向最大匹配算法实现:假设已经有正向匹配算法源码,则可以将文档进行倒序处理,生成逆序文档,然后根据逆序词典,对逆序文档使用正向最大匹配法处理即可。同理已经存在逆向最大匹配算法,则只要将文档倒序处理,正向词典倒序变为逆序词典,则可以送入逆向西大匹配算法中进行分词处理。 class IMM(object): def...原创 2019-02-12 16:30:41 · 2025 阅读 · 0 评论 -
jieba下TextRank实现
TextRank实现步骤如下: #这一段是抄了别人的(1)把给定的文本按照完整的句子进行分割;(2)对每个句子进行分词和词性标注,过滤停用词,只保留特定词性;(3)构建候选关键词图G=(V, E),首先生成关键词集((2)生成),然后采用共现关系构造两点之间的边,两个节点之间边仅在对应词汇长度为K的窗口中出现,K表示窗口大小;(4)迭代传播各节点的权重,直至收敛(5...原创 2019-03-29 20:02:58 · 2462 阅读 · 1 评论 -
对jieba分词的 分词模型进行抽取,简单实现
因为水平一般,所以将jieba库中分词模块的代码进行简化,这里全部使用函数实现import jiebafrom jieba.finalseg.prob_emit import P as emit_pfrom jieba.finalseg.prob_start import P as start_pfrom jieba.finalseg.prob_trans import P as t...原创 2019-03-29 20:10:36 · 1439 阅读 · 0 评论 -
受jieba下的HMM的矩阵保存启发,自己尝试制作类似矩阵文件
#实现一个和jieba里面使用.py文件存放字典的程序"""1.将字典保存到文件--> 挑选保存文件的格式2.文件名称是否需要修改,即1操作完成后得到的文件可否直接使用3.加载文件,添加目录"""import json#1.将字典写入文件#2.提供字典对象,用来调用p = { "name": "Tom", "age": 23}path = r"E:\...原创 2019-03-30 17:44:14 · 160 阅读 · 0 评论 -
在文件最上面添加一行数据 Python实现
import syssys.path.append(path)from dic1 import ppath = r"E:\学习相关资料\NLP"file = open(path + r"\dic1.py", "w+")file.write("p = ")json.dump(p, file, indent=4)file.close()dic1为 dic.py 文件,想要在它的最上...原创 2019-03-30 19:33:06 · 2960 阅读 · 0 评论 -
Python 利用scipy.optimize手写最小二乘法目标函数及优化算法
本文通过最小二乘法的矩阵实现形式和for循环遍历形式分别实现最小二乘法的实现,其中参数学习过程使用BFGS算法。(1)通过矩阵实现,代码如下:import numpy as npimport scipy.optimize as optimport matplotlib.pyplot as pltpoints = []shape = []np.rando...原创 2019-04-15 16:07:17 · 3118 阅读 · 0 评论 -
如何将词向量部分向量设置为可训练,其他不可训练
在 tensorflow 中加载预训练的词向量时,存在一个问题,UNK 没有被训练, 如果添加 UNK 需要随机初始化,但是这样不可避免会影响精度,所以,尝试着将词向量设置成部分可训练,部分不可训练。在写的时候想到,可以将 UNK 和 预训练的词向量分开定义,将词向量的变量设置为不可训练,UNK 设置为可训练,然后将这些变量连接起来即可。代码如下:import tensorflow as...原创 2019-06-11 20:17:34 · 886 阅读 · 0 评论 -
tensorflow 从最近一次 checkpoint 加载模型last_checkpoint
import tensorflow as tftf.reset_default_graph()global_step = tf.Variable(1, name="global_step")global_step1 = tf.Variable(1, name="global_step1")add_0 = global_step + global_step1ckpt_path =...原创 2019-05-26 19:34:26 · 3350 阅读 · 2 评论 -
tensorflow中变量和张量连接起来
import tensorflow as tfinput_x = tf.Variable([1, 2, 3], dtype=tf.float32)ones = tf.ones([3,], dtype=tf.float32)concat = tf.concat([input_x, ones], axis=0)sess = tf.Session()sess.run(tf.global_v...原创 2019-05-31 21:11:57 · 748 阅读 · 0 评论 -
利用viterbi算法计算出现概率最大字串
很多人写的viterbi算法过于依赖HMM,进行分词、命名实体识别什么的,因为反而对于这种单纯计算字符串概率最大组合的程序较少:MIN_FLOAT = -3.14E100"""每一步包含的词汇列表"""step1 = ["two"]step2 = ["of", "off", "on"]step3 = ["the", "thew"]step4 = ["people"]sta...原创 2019-08-19 18:20:05 · 764 阅读 · 0 评论 -
tree下subtree.node NotImplementedError: Use label() to access a node label.报错
NotImplementedError: Use label() to access a node label.原创 2017-12-11 19:23:13 · 829 阅读 · 0 评论 -
tensorboard同时显示训练数据和测试数据的曲线
学着用tensorboard在一个模型里面有训练模型和测试模型的损失函数曲线对比,上网找了好多,但是还都是一个曲线,即自己画的是这样的但是想要的是这样的:到底应该怎么样呢?简单操作:tensorboard --logdir=run1:"/home/.../summary",run2:"/home/.../summary" 其实只要在终端同时运行几个events即可,events就是summary生...原创 2018-06-03 10:09:54 · 20265 阅读 · 7 评论 -
tensorflow下MNIST程序的运行、结果的保存、变量的重载
程序主要包括两部分:程序的保存程序变量的重载第一部分:程序的保存import tensorflow as tfimport numpy as npimport osfrom tensorflow.examples.tutorials.mnist import input_datamnist = input_data.read_data_sets("MNIST_data/", one_ho...原创 2018-06-03 19:31:52 · 399 阅读 · 0 评论 -
matplotlib绘制折线图,包含添加标签
#coding:utf-8import numpy as npimport matplotlib.pyplot as plta = np.arange(0.0, 5.0, 0.02)plt.plot(a, np.cos(2*np.pi*a), "r--")'''plt.xlabel() 对X轴添加文本标签plt.ylabel() 对Y轴添加文本标签plt.title(...原创 2018-06-03 20:19:55 · 12222 阅读 · 0 评论 -
转发一篇大神的 文章Python的networkx绘制精美网络图
准发,以作备用点击打开链接转载 2018-06-03 21:55:35 · 12979 阅读 · 0 评论 -
tensorflow 入门级别程序实现
import tensorflow as tffrom numpy.random import RandomStateimport mathlearning_rate = 0.01MAX_STEPS = 1001rdm = RandomState(1)dataset_size = 256validation_rate = 0.2validation_size = math.flo...原创 2018-06-11 22:26:10 · 331 阅读 · 0 评论 -
tensorflow下实现SVM模型
import tensorflow as tfimport numpy as npfrom sklearn import datasetsfrom sklearn.cluster import KMeansfrom sklearn import svmimport mathfrom sklearn.metrics import precision_scoreimport matplo...原创 2018-06-20 20:51:53 · 1632 阅读 · 0 评论 -
tensorflow 中dataset常规使用方法
tf.data.Dataset.from_tensor_slices(array)获取分片数据,将输入的array按照第0维度分片dataset.make_initializable_iterator() 创建dataset迭代器,需要进行初始化one_element = iterator.get_next() 从迭代器中获取一个iter的数据iterator.initializer 迭代器初始化...原创 2018-06-20 22:22:14 · 2632 阅读 · 0 评论 -
RNN举例
import tensorflow as tffrom numpy.random import RandomStateimport math#hyperparametersNUM_BATCH = 100MAX_STEPS = 9hidden_size = 8n_inputs = 2n_steps = 3batch_size = 5dataset_size = n_steps ...原创 2018-06-13 18:47:37 · 542 阅读 · 0 评论 -
tensorflow中迭代产生数据时结果通过tensorboard显示
本方法从stack overflow获得You can create a tf.Summary object in your Python program and write it to the same tf.summary.FileWriter object that takes your TensorFlow-produced summaries using the SummaryWri...原创 2018-06-13 19:09:10 · 1891 阅读 · 0 评论 -
KNN实例
from sklearn.neighbors import KNeighborsClassifierimport numpy as npimport matplotlibimport matplotlib.pyplot as pltfrom sklearn import preprocessingdictionary = {1: "no", 2: "yes", 3: "ok"}de...原创 2018-04-23 09:05:42 · 734 阅读 · 0 评论 -
sklearn.preprocessing数据标准化实现流程
python中对于训练集一般需要标准化,即将原数据的均值变为0,方差变为1有两种方式:from sklearn import preprocessing第一种:使用scale模块直接计算标准化,将标准化的array放在x_scale中,同时可以查看均值和标准差,但是该方式的一个不足是当存在新的样本到来时,无法利用已有的模块直接复用,需要利用mean和std自己计算。x_scale = prepro...原创 2018-04-23 08:46:20 · 1507 阅读 · 0 评论 -
numpy的一个有趣特性
x = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9], [1, 2, 3]])此时shape为(4, 3)x[1].shape这时x[1]的shape就变为(3, )原创 2018-04-22 21:34:57 · 316 阅读 · 0 评论 -
关于隐马尔可夫模型中viterbi算法理解,修正大部分人理解错误
viterbi算法是一种动态规划算法,用于寻找最优隐含状态序列。(原谅我不会输公式)在HMM中,viterbi算法用于实现在给定观察序列O和模型参数时查找最优隐藏状态序列。但是我发现好多资料上提供算法不一致,使人混淆,所以将我的理解放在这,应该没问题。算法出现歧义的地方在(2)的递推算法的理解上,max和argmax对应的是右边的整个式子还是单指中括号内部,我发原创 2018-01-14 10:16:39 · 834 阅读 · 1 评论 -
零基础理解PCA中蕴含数学原理
今天看PCA原理时看到的一篇很好的文章,因为不是来自CSDN的,所以就不要脸的转一下链接,对于不太理解PCA的同学可以看一下。PCA数学原理转载 2018-03-10 22:55:17 · 180 阅读 · 0 评论 -
python3中遇到的一个bug TypeError: is_empty() takes 0 positional arguments but 1 was given
class PrioQueue: """" implementing priority queues using hearps """ def __init__(self, elist=[]): self.elems = list(elist) if self.elems: self.buildheaps()...原创 2018-03-14 09:32:28 · 2742 阅读 · 0 评论 -
读《word2vec中的数学原理详解》的一点理解
这里添加一个链接,很好的一篇word2vec的文章,叫做《word2vec中的数学原理详解》点击打开链接本人上传了在知网看到的一篇 language model + RNN的文章,因为自己也是新手,所以上传,如果需要,可以到我的下载页看一下,名称叫 基于循环神经网络的汉语语言模型建模方法。传统的统计语言模型n-gram发展到神经概率语言模型,主要的一个改进就是网络能够以当前词的上下文作为依据,预测...原创 2018-03-23 22:02:40 · 4420 阅读 · 1 评论 -
K-mean实现
import numpy as npfrom sklearn.cluster import KMeansdef loadDdta(filepath): fr = open(filepath, 'r', encoding='GBK')#编码方式需要写上去,查看city.txt格式为ISO-8859,这里可以用GBK lines = fr.readlines() retD...原创 2018-03-25 18:48:12 · 221 阅读 · 0 评论 -
python机器学习应用案例---PCA
因为之前也没有见过什么数据,所以就将数据集打印到文件,新手可以一起看一看,高手就不用在看了。import matplotlib.pyplot as pltfrom sklearn.decomposition import PCAfrom sklearn.datasets import load_irisdata = load_iris()y = data.targetx = data....原创 2018-03-26 20:05:01 · 579 阅读 · 1 评论 -
中文文本数据结构化处理实例
import jiebaimport gensimfrom gensim import corporafrom gensim.matutils import corpus2densef = open("背影.txt", "r+") #选取文档为中文的《背影》,将文档放在当前目录下text1 = f.readlines() #读取文件,按行读取,存入列表read = ...原创 2018-03-29 09:24:04 · 7941 阅读 · 1 评论 -
memoryerror
emma = nltk.Text(nltk.corpus.gutenberg.words('austen-emma.txt'))emma = emmafrom sklearn.feature_extraction.text import CountVectorizerdtm_vectorizer = CountVectorizer(stop_words='english')dtm = dt...原创 2018-03-29 10:41:21 · 3291 阅读 · 4 评论 -
numpy.zeros()将字符串格式变为numpy.float64
y = numpy.zeros(shape=(1, 2))print(y[0][0])<class 'numpy.float64'>y[0][0] = '12'print(y[0][0])y[0][0] = 'asasdf'print(y[0][0]) #报错声明y = numpy.zeros(shape=(1, 2))时, 默认y中元素类型为float64,之后再将字...原创 2018-04-22 19:05:37 · 2108 阅读 · 0 评论 -
tf.TensorArray简单教程
今天看tensorflow时遇到 tf.TensorArray,写一个见到的教程指导使用import tensorflow as tfsess = tf.Session()x = np.arange(20) input_ta = tf.TensorArray(size=0, dtype=tf.int32, dynamic_size=True)input_ta = input_ta.uns...原创 2018-06-10 11:28:29 · 12452 阅读 · 3 评论 -
spark在windows下使用jupyter设置
@echo offremrem Licensed to the Apache Software Foundation (ASF) under one or morerem contributor license agreements. See the NOTICE file distributed withrem this work for additional information...原创 2018-06-28 14:55:24 · 1047 阅读 · 0 评论