算法
Searching_Lion
这个作者很懒,什么都没留下…
展开
-
caffe:图像数据 lmdb的写入
def image_dataset_to_lmdb(image_folder_path,lmdb_path,posAttributeList): db = lmdb.open(lmdb_path, map_size=2147483648)with db.begin(write=True) as db_txn:for parent, dirnames, filenames in os原创 2016-06-03 01:36:56 · 573 阅读 · 0 评论 -
caffe mean file:npy
blob = caffe.BlobProto()data = open(dbpath, "rb").read()blob.ParseFromString(data)nparray = blob.proto_to_array(blob)f = file("my_mean.npy","wb")np.save(f,nparray)原创 2016-06-03 01:34:21 · 874 阅读 · 0 评论 -
TF-IDF算法
TF-IDF及其算法概念 TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的转载 2015-07-08 00:58:05 · 485 阅读 · 0 评论 -
基于朴素贝叶斯到中文垃圾邮件分类器
简介: 朴素 贝叶斯垃圾邮件分类器是在对邮件关键字进行统计分析到基础上利用贝叶斯公式进行分类到方法。相比其他模型,朴素贝叶斯模型到搭建比较简单,并且具有良好到分类效果。 朴素真贝叶斯分类器通过对邮件关键字进行统计,然后使用贝叶斯推理来计算一封电子邮件是或不是垃圾邮件的概率。贝叶斯定理: 表示事件B已经发生的前提下,事件A发生的概率,叫做事件B发生下事件A的条件概率。原创 2015-07-07 01:11:12 · 8853 阅读 · 1 评论 -
分类器总结
翻译 2015-07-13 12:19:15 · 452 阅读 · 0 评论 -
分类器的种类
分类器总体来说可以分成如下两类分类器统计分类器回归分类器朴素贝叶斯贝叶斯网络结构化分类器基于规则的分类器基于距离的分类器神经网络原创 2015-05-26 00:32:55 · 6343 阅读 · 0 评论 -
数据取对数运算的意义
平时在一些数据处理中,经常会把原始数据取对数后进一步处理。之所以这样做是基于对数函数在其定义域内是单调增函数,取对数后不会改变数据的相对关系,取对数作用主要有:1. 缩小数据的绝对数值,方便计算。例如,每个数据项的值都很大,许多这样的值进行计算可能对超过常用数据类型的取值范围,这时取对数,就把数值缩小了,例如TF-IDF计算时,由于在大规模语料库中,很多词的频率是非常大的数转载 2015-07-08 00:43:05 · 4796 阅读 · 1 评论 -
人工智能基本知识体系
AI概念:人工智能=人造物(计算机)+智能(特殊化程序)智能体(intelligent agent):自主决策智能体的基本能力:自主性,学习进化,社会性(agent之间的协作交互)。Part 1: 问题的求解搜索技术:问题的答案可以通过搜索的方式得到则解决问题是可以采用搜索技术无信息搜索技术(盲目搜索,例如广度优先,深度优先)启发式搜索:在启发函数的引导下进行搜原创 2015-05-16 22:50:05 · 1179 阅读 · 0 评论