机器学习
lovychen
理解生活,并学着享受生活
展开
-
用knn算法来预测喜爱程度
能根据对方的一些特征判断他(她)对你的吸引程度,是不喜欢,还是一般喜欢,还是很喜欢。以此改进约会配对效果。1、有一千组数据,前200作为测试数据,后800个作为样本数据,然后训练模型2、然后吧特征变量归一化去增加数据的可靠性,同时调整k值的参数来提高预测的准确度3,准确度达到一定程度后,然后输入用户数据来进行匹配最优的人#! /usr/bin/env python# -*- co转载 2016-08-29 20:17:34 · 2637 阅读 · 0 评论 -
特征变量归一化
归一化化定义:归一化化就是要把你需要处理的数据经过处理后(通过某种算法)限制在你需要的一定范围内。首先归一化是为了后面数据处理的方便,其次是保正程序运行时收敛加快。方法有如下:1、线性函数转换,表达式如下: y=(x-MinValue)/(MaxValue-MinValue) 说明:x、y分别为转换前、后的值,MaxValue、MinValue分 别为样本的最大值和最小值。转载 2016-08-25 10:55:37 · 3200 阅读 · 0 评论 -
keras(1):DNN
转载:http://www.cnblogs.com/zhangbojiangfeng/p/6362936.html输入的数据集是10000行,31645列,其中前31644是特征,最后一列是标签值。训练集和测试集格式是一样的。特征值都是0,1形式,表示有还是没有这个特征,标签值是0,1形式,2分类。import kerasimport tensorflow as t转载 2017-08-31 12:48:25 · 1114 阅读 · 0 评论 -
SRILM的安装与使用
安装 SRILM是一个统计和分析语言模型的工具,提供一些命令行工具,如ngram,ngram-count,可以很方便的统计NGRAM的语言模型。1、安装依赖包c/c++ compiler,GNU make,GNU gawk,GNU gzip,bzip2,P7zip,csh,Tcl。 Tcl 可嵌入式脚本语言。用于脚本编程和测试,这里是为了SRILM的测试。下载地址 h转载 2017-09-12 20:00:33 · 1566 阅读 · 1 评论