NLP
JOY酷酷
这个作者很懒,什么都没留下…
展开
-
利用Bio.Cluster进行聚类
# -*- coding: UTF-8 -*- from Bio.Cluster import * #http://biopython.org/DIST/docs/api#用k-means 或 k-median进行聚类,K为聚类数def KCluster(data, K=2): clusterid, error, nfound = kcluster (data, ncluste原创 2017-03-08 16:00:37 · 2124 阅读 · 1 评论 -
Tensorflow 的初步学习
# coding: utf-8import tensorflow as tf # 建立两个矩阵matrix1 = tf.constant([[3,3]])matrix2 = tf.constant([[2],[2]])# 矩阵乘法product = tf.matmul(matrix1, matrix2)# 方式1: 直接获取sess = tf.Session()result原创 2017-12-02 02:08:29 · 202 阅读 · 0 评论 -
初学 Tensorflow(线性回归预测)
大致过程是:先生成函数为 y = 0.1x + 0.3 的x、y的数据,即 k = 0.1, b = 0.3设 k, b 初始为随机数,进行 200 次学习,每隔 20 次输出一下训练结果具体代码如下:# coding: utf-8import tensorflow as tf import numpy as np # 创造数据,y = 0.1x + 0.3x_d原创 2017-12-02 01:55:00 · 316 阅读 · 0 评论 -
决策树算法
原创 2017-05-08 17:33:57 · 342 阅读 · 0 评论 -
最邻近规则分类算法(KNN)
原创 2017-05-08 17:29:19 · 678 阅读 · 0 评论 -
POS Tag 学习笔记
点击打开链接转载 2017-04-12 22:47:27 · 959 阅读 · 0 评论 -
推荐系统评测指标—准确率(Precision)、召回率(Recall)、F值(F-Measure)
点击打开链接转载 2017-04-13 21:45:16 · 1203 阅读 · 0 评论 -
英文分词算法(Porter stemmer)
英文分词算法(Porter stemmer)主要可以实现单词原型的还原,官网http://tartarus.org/~martin/PorterStemmer/一些词汇的处理结果:http://snowball.tartarus.org/algorithms/porter/diffs.txt官方给出的主程序代码:https://tartarus.org/martin/PorterS原创 2017-03-05 18:08:24 · 5444 阅读 · 0 评论 -
利用NLTK进行分句分词
1.输入一个段落,分成句子(Punkt句子分割器)import nltkimport nltk.datadef splitSentence(paragraph): tokenizer = nltk.data.load('tokenizers/punkt/english.pickle') sentences = tokenizer.tokenize(paragraph)原创 2017-03-05 17:16:45 · 24137 阅读 · 1 评论 -
初学 Tensorflow (构造神经网络)
# coding: utf-8import tensorflow as tf import numpy as np# 添加层(输入数据,输入单位,输出单位,激励函数)def add_layer(inputs, in_size, out_size, activation_fuction = None): # 行数为 in_size, 列数为 out_size 的矩阵 Wei原创 2017-12-03 00:40:26 · 410 阅读 · 0 评论