机器学习
文章平均质量分 86
狄克推多er
多年前我怀揣憧憬与梦想来到了这里,可是现实的遭遇让我疲于应付,自今日起我会继续探索我的梦想。
展开
-
基于Python3.6编写的jieba分词组件+Scikit-Learn库+朴素贝叶斯算法小型中文自动分类程序
实验主题:大规模数字化(中文)信息资源信息组织所包含的基本流程以及各个环节执行的任务。本文所采用的分类及程序框架主要参考了这篇博客基本流程:如下图所示,和信息资源信息组织的基本流程类似,大规模数字化(中文)信息资源组织的基本流程也如下:1信息资源的预处理、2信息外部特征描述、3信息内部特征标引、4信息资源的分类、5得到序化的信息资源 图11.1在信息资源预处理环节,首先要选择处理文本的范围,建立分...原创 2018-03-26 20:06:39 · 1971 阅读 · 1 评论 -
python机器学习之--用凝聚层次聚类进行数据分组
1.什么是层次聚类def perfrom_clustering(X,connectivity,title,num_clusters=3,linkage='ward'): plt.figure() model = AgglomerativeClustering(linkage=linkage, connectivity=connectivity,n_clust...原创 2018-04-30 23:04:50 · 1651 阅读 · 0 评论 -
利用python构建推荐引擎小项目实战
本次写的构建推荐引擎是一个晓得project,依赖于三个源文件:find_similar_user.py pearson_score.py euclidean_score.py以及最后的实现部分。一个json数据文件,格式如下: "John Carson": { "Inception": 2.5, "Pulp Fiction": 3.5, ...原创 2018-05-03 23:26:06 · 708 阅读 · 1 评论