python
文章平均质量分 81
Wengs95
一往无前
展开
-
Python爬虫爬取知乎用户信息+寻找潜在客户
【Python应用】寻找社交网络中的目标用户这是我们学校的软件工程课程设计的题目,要求自行编写爬虫或者利用开放的API获取新浪微博、知乎等社交网站的用户信息,利用数据挖掘的相关算法进行分析, 从大规模的用户群体中, 分别找出其中具有海淘或母婴购物意向的用户。原创 2017-07-27 17:50:57 · 18423 阅读 · 8 评论 -
《机器学习实战》代码片段学习1 k-近邻算法
最近开始系统的做一些机器学习方面的学习,选中了图灵程序设计丛书的《机器学习实战》作为教材。开发环境上个人选择了集成了python2.7与各类数据分析相关的python包的Anaconda4.4。原创 2017-08-24 00:25:48 · 236 阅读 · 0 评论 -
《机器学习实战》代码片段学习2 决策树
决策树概述决策树可以根据对输入特征属性的层层筛选选定数据所属的类。决策树能直观的展示数据的结构层次,利于理解。“…决策树可以使用不熟悉的数据集合,并从中提取出一系列规则,在这些机器根据数据创建规则时,就是机器学习的过程。”原创 2017-08-26 15:11:58 · 196 阅读 · 0 评论 -
《机器学习实战》代码片段学习5 AdaBoost元算法
svm那一章看的太吃力…先缓缓,回头再收拾它(简介基于同一分类器多个不同实例的两种计算方法:bagging与boostingBagging:从原始数据集选择S次后得到S个新数据集的一种技术,将某个学习算法串行作用于每个数据集就得到了S个分类器。对新数据进行分类时,用这S个分类器进行分类,并选择分类器投票结果中最多的类别作为最后的分类结果。Boosting:关注被已有分类器错分的数据来获取新的分类器。原创 2017-09-04 22:08:30 · 267 阅读 · 0 评论 -
《机器学习实战》代码片段学习4 Logistic回归
知识储备:Logistic回归进行分类的主要思想:根据现有数据对分类边界线建立回归公式,以此进行分类。原创 2017-08-30 17:05:00 · 303 阅读 · 0 评论 -
《机器学习实战》代码片段学习3 朴素贝叶斯
知识储备:贝叶斯决策核心思想:选择具有最高概率的决策。贝叶斯准则: 利用贝叶斯准则我们可以交换条件概率中的条件与结果。朴素贝叶斯假设:1.每个特征相互独立。2.每个特征同等重要。朴素贝叶斯分类器的优缺点: 优点:在数据较少的情况下仍然有效,可以处理多类别问题。 缺点:对于输入数据的准备方式较为敏感。 适用数据类型:标称型数据。原创 2017-08-28 22:57:50 · 363 阅读 · 0 评论 -
《机器学习实战》代码片段学习6 k均值聚类与二分k均值聚类
概述:本章开始进入无监督学习的内容。聚类方法将相似的对象分到同一个簇中。原创 2017-09-11 09:23:21 · 385 阅读 · 0 评论 -
利用爬虫和Django+echarts建立自己的动画人气统计小站
开发环境:Django版本1.11.4,python版本3.6.0原创 2017-09-02 00:58:33 · 3391 阅读 · 0 评论 -
一个Bangumi.tv的爬虫
一个爬取Bangumi.tv动画数据的小爬虫原创 2017-10-23 19:08:27 · 2675 阅读 · 0 评论