智能信息处理
文章平均质量分 78
BanskyCL
咸鱼
展开
-
智能信息处理(六)
分类 classification1 分类介绍模型构造模型使用2 分类方法2.1 基本分类器基于规则的方法决策树基于存储的推理朴素贝叶斯KNN神经网络支持向量机2.2 整体分类器boostingbagging随机森林3 决策树 Decision Tree3.1 属性选择虽然可以采用任何一个属性对数据集进行划分,但最后形成的决策树会差异很大。需要寻找合适的属性选择方法。选择标准:Gini系数是一种不纯度函数,用来度量数据集的数据关于类的纯度。信息增益是原创 2021-05-06 20:50:11 · 451 阅读 · 0 评论 -
智能信息处理(五)
关联规则挖掘Association rule mining1.应用捆绑销售个性化推荐医疗诊断web挖掘2.目的关联分析用以发现事物间存在的关联性3.任务给定一组事务,寻找预测 “某些项将会随其他项的出现而出现”的规则4.频繁项集Frequent itemset4.1 项集itemset多个项的集合 : {1,2,3}4.2 k项集k-itemset含k个项的集合: 3项集:{1,2,3}4.3 支持度support包含项集的比例,如,s({Milk, Bread, D原创 2021-04-19 19:35:52 · 236 阅读 · 0 评论 -
智能信息处理(四)
相似度与相异度Similarity and Dissimilarity1.相似度1.1 连续属性r 的取值范围在[-1,1],r的值越接近1或-1,表示两特征的相关性越强,越接近于0,相关性越弱1.1.1 线性相关系数1.1.2 余弦相似度1.2 离散属性1.2.1 互信息特征X的信息熵,P(Xi)为X发生的概率,H(X)的单位是bit已知变量y后x的条件信息熵Information Gain 信息增益Mutual Information 互信息1.3 物体间距相似度原创 2021-04-16 21:37:41 · 215 阅读 · 0 评论 -
智能信息处理(三)
信息与知识Information and Knowledge1.数据与数据类型数据属性数据集2.数据的统计特征又称为汇总统计,用单个数或数的小集合来捕获大的数据集的各种属性特征2.1 中心趋势度量(Central Tendency)算术均值(mean)加权算术均值(weighted arithmetic mean)截断均值(Trimmed mean):指定0和100间的百分位数p,丢弃高端和低端(p/2)% 的数据,然后用常规方法计算均值,所得的结果即是截断均值。中位数(med原创 2021-04-16 19:54:11 · 215 阅读 · 0 评论 -
智能信息处理(二)
人工智能介绍(讲烂了都,所以就整理一下笔记算了1.学派符号主义(心理学派):采用功能模拟方法联结主义(生理学派):采用结构模拟行为主义(控制论学派):采用行为模拟2.分类创建智能认知智能:语言、知识、推理感知智能:听觉、视觉、触觉运算智能:记忆、计算3.领域4.机器学习5.深度学习文章内容来自课程ppt,侵删...原创 2021-04-16 11:27:55 · 173 阅读 · 0 评论 -
智能信息处理(一)
智能信息处理(IIP)Intelligent Information Processing1.概念模拟人或其它生物处理信息的行为,建立处理复杂系统信息的理论、算法和系统的一些方法和技术2.特点不需要建立问题的精确描述3.基础以人工智能导论为基础,融合渗透数据挖掘。4.例子“啤酒与尿布”,超市货架组织,关联销售,购物篮分析网上购物,广告投放,定向营销客户流失分析信息检索,智能搜索入侵检测5.技术背景超大规模数据库的出现先进的计算机技术对海量数据的快速访问统计方法深入原创 2021-04-16 11:15:16 · 1613 阅读 · 0 评论