python
文章平均质量分 76
AI点滴积累
这个作者很懒,什么都没留下…
展开
-
爬取必胜客餐厅信息
本文转载自:http://gkhelp.cn/1206.html当我刚接触 Python 时,我已经被 Python 深深所吸引。Python 吸引我的地方不仅仅能用其编写网络爬虫,而且能用于数据分析。我能将大量的数据中以图形化方式呈现出来,更加直观的解读数据。数据分析的前提是有数据可分析。如果没有数据怎么办?一是可以去一些数据网站下载相关的数据,不过数据内容可能不是自己想要的。二是自己...转载 2018-11-26 11:48:36 · 212 阅读 · 0 评论 -
机器学习——K-近邻(KNN)算法
本文转载自:https://www.cnblogs.com/ybjourney/p/4702562.html 一 . K-近邻算法(KNN)概述最简单最初级的分类器是将全部的训练数据所对应的类别都记录下来,当测试对象的属性和某个训练对象的属性完全匹配时,便可以对其进行分类。但是怎么可能所有测试对象都会找到与之完全匹配的训练对象呢,其次就是存在一个测试对象同时与多个训练对象匹配,导致一个...转载 2018-11-27 15:21:38 · 244 阅读 · 0 评论 -
机器学习——K-均值聚类(K-means)算法
本文转载自:https://www.cnblogs.com/ybjourney/p/4714870.html 一 K-均值聚类(K-means)概述聚类“类”指的是具有相似性的集合。聚类是指将数据集划分为若干类,使得类内之间的数据最为相似,各类之间的数据相似度差别尽可能大。聚类分析就是以相似性为基础,对数据集进行聚类划分,属于无监督学习。无监督学习和监督学习上一篇对KNN...转载 2018-11-27 15:46:01 · 353 阅读 · 0 评论 -
全国 41611 个景点,用 Python 告诉你哪些地方最值得一游!
本文转载自:https://mp.weixin.qq.com/s?__biz=MzA3OTAxMDQzNQ==&mid=2650617111&idx=1&sn=3120d94c0fc61eec3bbc1689fb062767&chksm=87b39afbb0c413ed3f182b77ea5ad212612deb9cf25a2e4de3d38957ccf73f54...转载 2018-11-27 21:24:34 · 204 阅读 · 0 评论 -
爬取 48048 条评论,解读 9.3 分的「毒液」是否值得一看?
本文转载自:https://mp.weixin.qq.com/s?__biz=MzA4MjEyNTA5Mw==&mid=2652568697&idx=1&sn=e2e52e392996202b2e4142462594e953&chksm=8464d433b3135d25d066b37f4899070e195a96b5ddde7b6d4cf9ba4ee4092676...转载 2018-11-28 11:12:54 · 123 阅读 · 0 评论 -
一文看懂机器学习流程(客户流失率预测)
本文转自:https://my.oschina.net/sizhe/blog/15947911 定义问题客户流失率问题是电信运营商面临得一项重要课题,也是一个较为流行的案例。根据测算,招揽新的客户比保留住既有客户的花费大得多(通常5-20倍的差距)。因此,如何保留住现在的客户对运营商而言是一项非常有意义的事情。 本文希望通过一个公开数据的客户流失率问题分析,能够带着大家理解如何应用机器学...转载 2018-12-14 10:53:10 · 364 阅读 · 0 评论 -
Scrapy爬取京东商城华为全系列手机评论
本文转自:https://mp.weixin.qq.com/s?__biz=MzA4MTk3ODI2OA==&mid=2650342004&idx=1&sn=4d270ab7ca54f6f2f7ec7aca113993f4&chksm=87811487b0f69d91d2b3a072be22e50b436e342e05cea6c1e28c9ade4c814f8ba...转载 2018-12-09 21:29:08 · 290 阅读 · 0 评论 -
数据挖掘领域十大经典算法之—SVM算法
本文转自:https://blog.csdn.net/fuqiuai/article/details/79483057简介SVM(Support Vector Machine)中文名为支持向量机,是常见的一种判别方法。在机器学习领域,是一个有监督的学习模型,通常用来进行模式识别、分类以及回归分析。相关概念分类器:分类器就是给定一个样本的数据,判定这个样本属于哪个类别的算法。例如在股票...转载 2018-12-21 12:03:29 · 331 阅读 · 1 评论 -
爬取虎嗅 5 万篇文章告诉你怎么样取标题
本文转自:https://mp.weixin.qq.com/s?__biz=MzA4MjEyNTA5Mw==&mid=2652568803&idx=1&sn=290ba9f6f781a7ca18b67396678756d6&chksm=8464d4a9b3135dbf7a6b61cb7c23ae4b437afc384c429fa0c268d502e2fa44375...转载 2018-12-16 15:19:19 · 248 阅读 · 0 评论 -
Python数据可视化:2018年电影分析
本文转载自:http://gkhelp.cn/1217.html 双11已经过去,双12即将来临,离2018年的结束也就2个月不到,还记得年初立下的flag吗?完成了多少?相信很多人和我一样,抱头痛哭...本次利用猫眼电影,实现对2018年的电影大数据进行分析。网页分析1、标签通过点击猫眼电影已经归类好的标签,得到网址信息。2、索引页打开开发人员工具,获取索引页里电影的...转载 2018-11-26 23:06:22 · 1367 阅读 · 0 评论 -
我分析了虎嗅网5万篇文章,发现这些秘密
本文转自:https://mp.weixin.qq.com/s?__biz=MzAxMjUyNDQ5OA==&mid=2653558174&idx=1&sn=4f4c1b389a92bf43c4142736f908fddc&chksm=806e3b23b719b2358c1bc3cd59fde58276173605806354e4ad8c6e324721f6a8a...转载 2018-12-04 11:48:29 · 290 阅读 · 0 评论 -
python版AI贪吃蛇
本文转自:https://mp.weixin.qq.com/s?__biz=MzU2NDI1MjkwNA==&mid=2247484020&idx=1&sn=73aa1452ddba05ae233e3e4a3aaa2ad6&chksm=fc4c9bf3cb3b12e5877f0bfc64c819bf7ffc302d1ad473ed3bea618cc923e978c...转载 2018-11-29 11:30:53 · 403 阅读 · 0 评论 -
Q-learing
本文转自:https://www.jianshu.com/p/29db50000e3f1、Q-learning例子假设有这样的房间如果将房间表示成点,然后用房间之间的连通关系表示成线,如下图所示:这就是房间对应的图。我们首先将agent(机器人)处于任何一个位置,让他自己走动,直到走到5房间,表示成功。为了能够走出去,我们将每个节点之间设置一定的权重,能够直接到达5的边设置为10...转载 2018-11-29 13:45:35 · 151 阅读 · 0 评论 -
利用层次聚类算法进行基于基站定位数据的商圈分析
本文转自:https://blog.csdn.net/bf02jgtrs00xktcx/article/details/793866621.背景与挖掘目标1.1 背景随着个人手机和网络的普及,手机已经基本成为所有人必须持有的工具。根据手机信号再地理空间的覆盖情况结合时间序列的手机定位数据可以完整的还原人群的现实活动轨迹从而得到人口空间分布于活动联系的特征信息。商圈是现代市场中的重要...转载 2018-11-29 14:29:43 · 783 阅读 · 0 评论 -
轻量级网络--ShuffleNet论文解读
本文转自:https://blog.csdn.net/u011974639/article/details/79200559Abstract论文介绍一个效率极高的CNN架构ShuffleNet,专门应用于计算力受限的移动设备。新的架构利用两个操作:逐点群卷积(pointwise group convolution)和通道混洗(channel shuffle),与现有先进模型相比在类似的精...转载 2018-11-29 16:26:37 · 193 阅读 · 0 评论 -
xgboost原理及应用
本文转载自:https://www.cnblogs.com/zhouxiaohui888/p/6008368.html1.背景关于xgboost的原理网络上的资源很少,大多数还停留在应用层面,本文通过学习陈天奇博士的PPT地址和xgboost导读和实战 地址,希望对xgboost原理进行深入理解。2.xgboost vs gbdt说到xgboost,不得不说gbdt。了解gbdt可以...转载 2018-11-26 17:10:56 · 144 阅读 · 0 评论 -
AdaBoost算法
本文转载自:https://blog.csdn.net/fuqiuai/article/details/79482487 简介Adaboost算法是一种提升方法,将多个弱分类器,组合成强分类器。 AdaBoost,是英文”Adaptive Boosting“(自适应增强)的缩写,由Yoav Freund和Robert Schapire在1995年提出。 它的自适应在于:前一个弱分类...转载 2018-11-26 18:48:49 · 204 阅读 · 0 评论 -
C4.5算法
本文转载自:https://blog.csdn.net/fuqiuai/article/details/79456971数据挖掘十大经典算法如下:简介C4.5是决策树算法的一种。决策树算法作为一种分类算法,目标就是将具有p维特征的n个样本分到c个类别中去。常见的决策树算法有ID3,C4.5,CART。基本思想下面以一个例子来详细说明C4.5的基本思想上述数据集有四个属性,属性...转载 2018-11-26 18:43:44 · 175 阅读 · 0 评论 -
用Python爬取手机APP
本文转自:https://mp.weixin.qq.com/s?__biz=MzAxMjUyNDQ5OA==&mid=2653558162&idx=1&sn=73ae2ee5d2453773bceec078e39ca0ed&chksm=806e3b2fb719b239d391e13812796e179f47490c9b2e9ff7819710cc94转载 2018-12-02 18:10:35 · 381 阅读 · 0 评论 -
30行代码实现微信自动回复机器人
本文转自:https://mp.weixin.qq.com/s?__biz=MzAxMjUyNDQ5OA==&mid=2653558126&idx=1&sn=b1a87e62fc2ae0a3b2e775dadf263ccc&chksm=806e3bd3b719b2c5a83684476a5b33f341c72b4b4399153ee3a2466a83c43d3b1b...转载 2018-12-02 18:07:07 · 4220 阅读 · 1 评论 -
爬取手机app
本文转自:https://blog.csdn.net/c406495762/article/details/76850843 1 前言 暑假回家,”小皇帝”般的生活持续了几天,头几天还挺舒服,闲久了顿时觉得好没意思。眼看着10天的假期就要结束,曾信誓旦旦地说要回家学习,可拿回家的两本书至今一页未翻,强烈的负罪感一直催促着:”你该...转载 2018-12-28 13:18:50 · 514 阅读 · 1 评论