![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
DATA MINING &machine learning
文章平均质量分 91
阿拉丁AI神灯花园
> 前大厂程序员 | 10年工作经验 | 后端软件技术专家 | 职业履历 AMZ | ALI | STARTUPS
> 喜欢前沿科技| AIGC | 身心灵能量成长 | 个人认知觉醒
> 生活美学爱好布道者 | 喜欢摄影 & 唱歌 & 户外 & 厨艺
展开
-
kmeans算法及python代码参考
算法介绍和分析请参考:http://hi.baidu.com/chenjinandy/blog/item/5c4d5344b607c3248794739e.html# -*- coding:gb2312 -*-'''Created on 2011-10-21 @author: chenjinandy'''from math import sqrtdef pearson(原创 2012-03-31 22:54:06 · 605 阅读 · 0 评论 -
数据挖掘十大经典算法之一--APRIORI
1 Apriori 算法 学习博客:http://blog.csdn.net/qq675927952/article/details/6707704 Apriori 算法是一关联规则算法,很多数据挖掘算法是在Apriori算法基础上改进的,比如散列、基于数据分隔的方法。 关联规则的目的在于在一个数据集中找出项之间的关系,也称之为购物蓝分析 (market原创 2012-03-31 22:50:37 · 1566 阅读 · 0 评论 -
pagerank算法解析和python小练手
1.1 、PageRank(网页级别)的概念 互联网发展早期的搜索引擎,对web页面的排序,是根据搜索的词组(短语)在页面中的出现次数(occurence ),并用页面长度和html标签的重要性提示等进行权重修订。链接名气(link popularity)技术通过其它文档链接到当前页面(inbound links)的链接数量来决定当前页的重要性,这样可以有效地抵制被人为加工的页面欺骗原创 2012-12-17 12:21:59 · 806 阅读 · 0 评论 -
KNN 算法解析和java 代码及python代码实现
kNN算法简介:kNN(k Nearest Neighbors)算法又叫k最临近方法, 总体来说kNN算法是相对比较容易理解的算法之一,假设每一个类包含多个样本数据,而且每个数据都有一个唯一的类标记表示这些样本是属于哪一个分类, kNN就是计算每个样本数据到待分类数据的距离,取和待分类数据最近的k各样本数据,那么这个k个样本数据中哪个类别的样本数据占多数,则待分类数据就属于该类别。原创 2012-12-17 12:18:24 · 1896 阅读 · 1 评论 -
数据挖掘十大经典算法之一--APRIOR 及python实现
1 Apriori 算法 Apriori 算法是一关联规则算法,很多数据挖掘算法是在Apriori算法基础上改进的,比如散列、基于数据分隔的方法。 关联规则的目的在于在一个数据集中找出项之间的关系,也称之为购物蓝分析 (market basketanalysis)。例如,购买鞋的顾客,有10%的可能也会买袜子,60%的买面包的顾客,也会买牛奶。这其中最有名原创 2012-12-17 12:24:11 · 3390 阅读 · 1 评论 -
kmeans算法及python代码参考
算法介绍和分析请参考:http://hi.baidu.com/chenjinandy/blog/item/5c4d5344b607c3248794739e.html# -*- coding:gb2312 -*-'''Created on 2011-10-21 @author: chenjinandy'''from math import sq原创 2012-12-17 12:19:55 · 639 阅读 · 0 评论 -
pagerank算法解析和python小练手
1.1 、PageRank(网页级别)的概念 互联网发展早期的搜索引擎,对web页面的排序,是根据搜索的词组(短语)在页面中的出现次数(occurence ),并用页面长度和html标签的重要性提示等进行权重修订。链接名气(link popularity)技术通过其它文档链接到当前页面(inbound links)的链接数量来决定当前页的重要性,这样可以有效地抵制被人为加工的页面欺骗搜索原创 2012-03-31 22:53:18 · 1475 阅读 · 0 评论 -
机器学习--线性回归和分类
机器学习--线性回归与分类【原创】本帖最后由 cloud@windy 于 2011-5-14 19:42 编辑 1. 线性回归在温洲的一个房产网(http://www.wzfc.net/)我弄到了下面的一些数据: 现在我们以横轴表示房子面积,纵轴表示房子价格,画到坐标轴上: 现在问题来了,我想要一套200平方米的房子价格大概是多少呢转载 2012-03-31 22:49:08 · 722 阅读 · 0 评论 -
搜索引擎技术简介
http://blog.csdn.net/v_july_v/article/details/6827391搜索引擎技术之概要预览前言 近些天在学校静心复习功课与梳理思路(找工作的事情暂缓),趁闲暇之际,常看有关搜索引擎相关技术类的文章,接触到不少此前未曾触碰到的诸多概念与技术,如爬虫,网页抓取,分词,索引,查询,排序等等,更惊叹于每一幅转载 2012-03-31 22:46:11 · 1576 阅读 · 0 评论 -
图说数据挖掘
http://blog.csdn.net/bacteria1987/article/details/72063961、数据挖掘需要‘神马样’的流程?2、哥,有没有详细点的,来个给力的! 3、数据挖掘在商业上的理解是? 4、数据在统计意义上有哪些类型?5、他们的含义是转载 2012-03-31 22:43:56 · 448 阅读 · 0 评论 -
ICTCLAS2010的JNI调用实现过程
ICTCLAS2010的JNI调用实现过程(2010-07-28 21:46:58)转载标签:ictclas2010jni调用java中文分词分类: 编程语言ICTCLAS2010的JNI调用实现过程JNI是Java Native Interface的缩写,中转载 2012-03-31 23:06:06 · 510 阅读 · 0 评论 -
KNN 算法解析和java 代码及python代码实现
kNN算法简介:kNN(k Nearest Neighbors)算法又叫k最临近方法, 总体来说kNN算法是相对比较容易理解的算法之一,假设每一个类包含多个样本数据,而且每个数据都有一个唯一的类标记表示这些样本是属于哪一个分类, kNN就是计算每个样本数据到待分类数据的距离,取和待分类数据最近的k各样本数据,那么这个k个样本数据中哪个类别的样本数据占多数,则待分类数据就属 于该类别。该算法原创 2012-03-31 22:55:05 · 644 阅读 · 0 评论 -
推荐系统简述-- 概念、方法、算法
推荐系统是近年来计算机数据领域很火的一个话题,其y原创 2014-09-24 23:35:57 · 224 阅读 · 0 评论