![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python数据挖掘入门与实践
北有鸣鹿
这个作者很懒,什么都没留下…
展开
-
7.用图挖掘找到感兴趣的人
# -*- coding: utf-8 -*-"""Created on Wed Oct 3 09:40:15 2018@author: asus"""#7 用图挖掘找到感兴趣的人#7.1 加载数据集#根据社交网络用户的好友信息,向他们推荐好友。逻辑为:如果两个用户有共同好友,那么这两#个人相似度很高,只得向彼此推荐。#国外的网站国内禁了#利用上一张介绍的Twitte...原创 2018-10-18 15:21:09 · 664 阅读 · 0 评论 -
5.用转换器抽取特征
# -*- coding: utf-8 -*-"""Created on Sat Sep 29 15:43:18 2018@author: asus"""#5 用转换器抽取特征#5.1 特征抽取#特征抽取是数据挖掘任务最为重要的一个环节,一般而言,它对最终结果的影响要过高数据挖掘#算法本身。#5.1.1 在模型中表示事实#特征选择,降低真实世界的复杂度,模型比现实更容易操...原创 2018-10-10 14:22:44 · 253 阅读 · 0 评论 -
4.亲和性分析算法
# -*- coding: utf-8 -*-"""Created on Thu Sep 27 10:59:39 2018@author: asus"""#4 用亲和性分析方法推荐电影#4.1 亲和性分析#亲和性分析用来寻找出两个对象同时出现的情况。#应用场景:欺诈检测;顾客区分;软件优化;产品推荐。#4.1.1 亲和性分析算法#Apriori算法#其他算法有Eclat...原创 2018-10-10 14:21:19 · 738 阅读 · 0 评论 -
3. 用决策树预测获胜球队
# -*- coding: utf-8 -*-"""Created on Sun Sep 23 16:15:30 2018@author: asus"""#3 用决策树预测获胜球队#3.1.2 用pandas加载数据集import pandas as pddataset = pd.read_csv("NBA.csv")dataset.ix[:5]dataset[datase...原创 2018-10-10 14:19:46 · 1988 阅读 · 1 评论 -
2. 用scikit-learn估计器分类
# -*- coding: utf-8 -*-"""Created on Sat Sep 22 09:43:28 2018@author: asus"""#2 用scikit-learn估计器分类#估计器(Estimator):用于分类、聚类和回归分析#转换器(Transformer):用于数据预处理和数据转换#流水线(Pipeline):组合数据挖掘流程,便于再次使用。#2...原创 2018-10-09 13:17:44 · 287 阅读 · 0 评论 -
1. 亲和性分析
-- coding: utf-8 --“”"Created on Tue Sep 18 08:03:55 2018@author: asus“”"#1 亲和性分析import numpy as npdataset_filename = “affinity_dataset.txt”x = np.loadtxt(dataset_filename)print(x[:5])featur...原创 2018-10-09 13:15:53 · 353 阅读 · 0 评论 -
11.用深度学习方法为图像中的物体进行分类
这几个库现在更新了,用书上的会出错,未解决,建议直接学新的# -*- coding: utf-8 -*-"""Created on Sun Oct 14 09:09:58 2018@author: asus"""#11 用深度学习方法为图像中的物体进行分类import osbatch1_filename = os.path.join( "E:\\books\Pyt...原创 2018-10-18 15:26:40 · 1773 阅读 · 0 评论 -
10.新闻语料分类
# -*- coding: utf-8 -*-"""Created on Mon Oct 8 16:41:10 2018@author: asus"""#10 新闻语料分类#10.1 获取新闻文章#本章将构建一个按照主题为最新的新闻报道分组的系统。你可以运行几周(或更长时间)以了解这#段时间新闻趋势的变化。#http://www.reddit.com/login#找不到...原创 2018-10-18 15:24:19 · 1405 阅读 · 0 评论 -
9.作者归属问题
# -*- coding: utf-8 -*-"""Created on Sun Oct 7 09:00:32 2018@author: asus"""#9 作者归属问题#9.1.3 获取数据import osimport sysdata_folder = os.path.join( "E:\\books\Python数据挖掘入门与实践\作者归属问题,支持向...原创 2018-10-18 15:23:08 · 718 阅读 · 0 评论 -
8.用神经网络破解验证码
# -*- coding: utf-8 -*-"""Created on Fri Oct 5 08:02:05 2018@author: asus"""#8 用神经网络破解验证码#8.2.1 绘制验证码import numpy as npfrom PIL import Image, ImageDraw, ImageFontfrom skimage import transf...原创 2018-10-18 15:22:12 · 1816 阅读 · 0 评论 -
6.使用朴素贝叶斯进行社会媒体挖掘
# -*- coding: utf-8 -*-"""Created on Tue Oct 2 07:58:33 2018@author: asus"""#6 使用朴素贝叶斯进行社会媒体挖掘#朴素贝叶斯算法在计算用于分类的概率时,为简化计算,假定各特征之间是相互独立的,因此名#字中含有朴素二字。#6.1 消歧#文本挖掘的一个难点来自于歧义,消除歧义常被称为消歧。一个词在文中的...原创 2018-10-10 14:24:40 · 943 阅读 · 1 评论