自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(15)
  • 收藏
  • 关注

原创 2018-12-09:Python每日一题

#181题目:扑克牌洗牌大家都会,我们就用python来做个洗牌的程序,规则是将牌平分为两半,再将两部分均匀的一张摞一张合在一起,重复这个过程多次后就会发现最终牌的次序又回到洗牌前的。先以6张牌举个例子:原牌序就用1, 2, 3, 4, 5, 6表示第一次洗牌,分成1, 2, 3和4, 5 ,6两部分,一张摞一张合在一起成为1, 4, 2, 5, 3, 6第二次洗牌,变成1, 5, ...

2018-12-09 11:58:22 348

原创 论一只爬虫的自我修养Day1

拖了很久才开始Python爬虫的学习。回忆起第一次接触到爬虫是胡喽跟我说想要爬亚马逊宠物零食的评论信息。当时我根据某一个品类挨个黏贴复制黏贴复制……,现在想想真是蠢萌。一、Python如何访问互联网urllib = URL + libURL:网页地址lib:首页URL的一般格式为(带方括号[]的为可选项):protocol :// hostname[:port] / path / [;parame...

2018-06-11 21:35:10 668

原创 Python数据挖掘实战——贝叶斯分类算法

一、概念1.1贝叶斯定理(Bayes Theorem)        eg.判断一个人品质的好坏是根据一个人过往的行为进行判断的,但是对于陌生人一开始初始化为50%好人、50%坏人,如果之后他做了一件好事,这个事会增加我们判断他为好人的根据。如果发现他做了一件坏事,会增加他是坏人的概率。1.2朴素贝叶斯分类(Naive Bayes Classifier)    贝叶斯分类算法,是统计学的一种分类方...

2018-05-20 14:29:57 4615 1

原创 Python数据挖掘实战——KNN算法(K最近邻节点算法,k-NearestNeighbor)

一、分类    分类是用来预测类别数据的一种方法,可以用来预测未来一段时间内用户是否会流失,预测用户是否会响应你的促销活动,能够评估用户的信用度是好还是差的一系列分类预测问题。二、概念2.1监督学习(Supervised Learning)    从给定标注的训练数据集中学习出一个函数,根据这个函数为新数据进行标注。(有因变量y)回归分类、分类、时间序列等。2.2无监督学习(Unsupervise...

2018-05-20 11:57:33 3032

原创 SQL练习:196. 删除重复的电子邮箱

编写一个SQL查询来删除Person表中所有重复的电子邮件,在重复的邮件中只保留Id最小的邮件。+----+------------------+| Id | Email |+----+------------------+| 1 | john@example.com || 2 | bob@example.com || 3 | john@example....

2018-05-18 09:37:37 3639

原创 Python数据挖掘实战——回归

一、回归分析(Regression Analysis)    研究自变量与因变量之间关系形式的分析方法,它主要是通过建立 因变量y 与影响它的自变量Xi(i=1,2,3....)之间的回归模型,来预测 因变量y 的发展趋势。二、回归分析的分类2.1线性回归分析:简单线性回归、多重线性回归2.2非线性回归分析:逻辑回归、神经网络三、简单线性回归模型y = a + bx + e(一元一次方程)1)y—...

2018-05-17 22:20:09 3152 1

原创 Python数据挖掘实战——相关分析

继续补以前拉下的债~~~一、相关性指标的研究意义1.1相关系数(Correlation coefficient):    相关系数是变量间关联程度的最基本测度之一1.2相关分析(Correlation analysis)    是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。二、相关系数的基本特征2.1方向:   ...

2018-05-17 21:19:28 4228

原创 mySQL菜鸟入门

http://www.runoob.com/mysql/mysql-install.html

2018-05-15 22:54:47 311

原创 Python数据挖掘——文本分析

一、定义:文本挖掘:从大量文本数据中抽取出有价值的知识,并且利用这些知识重新组织信息的过程。二、语料库(Corpus)语料库是我们要分析的所有文档的集合。# -*- coding: utf-8 -*-import osimport os.pathfilePaths = [] #定义一个数组变量,再用OS.walk的方法传入目录for root, dirs, files in os.wal...

2018-05-13 11:37:44 85322 13

原创 Python数据挖掘——概况

一、碎碎念        之前一直因为懒,没有把学了的给整理下来,现在慢慢补起来。二、数据挖掘概述 1.什么是数据挖掘?数据挖掘(data mining,简称DM),是指从大量的数据中,通过统计学、人工智能、机器学习等方法,挖掘出未知的、且有价值的信息和知识的过程。eg:啤酒与尿布、杜蕾斯与口红、杜蕾斯与红酒。==>达到增加商品销售的目的。数据挖掘误区:【实际】:1.数据挖掘是人们处理商业问...

2018-05-12 20:30:17 2901

原创 Kaggle——TMDB 5000 Movie Dataset电影数据分析

一、碎碎念    因为工作上有用到Excel做数据分析,之后慢慢接触到了Python做分析,做挖掘等。再然后就遇到了Kaggle这个网站,发现这里真是让人提升技能的圣地。一直在找些可以提升自己数据分析技能、思维的项目来练习,下面主要会展示一些自己的分析思路,可视化图表,以及代码。    看了kaggle上这个项目各路大神的代码思路,然后自己也跃跃欲试要操刀一练。分析完这个项目,给自己的领悟是对于部...

2018-05-11 19:56:04 17641 16

原创 Kaggle入门项目——Titanic(泰坦尼克之灾)

这个项目里

2018-05-10 15:10:36 989

原创 Python入门到实践——项目2(第17章 使用API)

17.1.2  使用 API 调用请求数据GitHub 的 API 让你能够通过 API 调用来请求各种信息。要知道 API 调用是什么样的,请在浏览器的地址栏中输入如下地址并按回车键:https://api.github.com/search/repositories?q=language:python&sort=stars这个调用返回 GitHub 当前托管了多少个 Python 项目...

2018-03-11 23:03:22 1156

原创 Python编程从入门到实践——第六章:字典

课后习题动手试一试6-1 人 :使用一个字典来存储一个熟人的信息,包括名、姓、年龄和居住的城市。该字典应包含键first_name 、last_name 、age 和city 。将存储在该字典中的每项信息都打印出来。familiar_person = { 'first_name' : 'Jack', 'last_name' : 'Wang', 'age' : '30', ...

2018-02-08 20:12:48 2216

原创 Python从入门到实践——第八章 函数

8.3.4  结合使用函数和 while  循环可将函数同本书前面介绍的任何 Python 结构结合起来使用。例如,下面将结合使用函数 get_formatted_name() 和 while 循环,以更正规的方式问候用户。下面尝试使用名和姓跟用户打招呼:greeter.pydef get_formatted_name(first_name,last_name): ""

2018-01-28 15:12:09 283

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除