python
onlynima
这个作者很懒,什么都没留下…
展开
-
逻辑回归(Logistic Regression)
一、Logistic Regression1.1 线性回归逻辑回归和线性回归本质上都是得到一条直线,不同的是,线性回归的直线是尽可能去拟合输入变量X的分布,使得训练集中所有样本点到直线的距离最短;而逻辑回归的直线是尽可能去拟合决策边界,使得训练集样本中的样本点尽可能分离开。因此,两者的目的是不同的。线性回归方程:此处,y为因变量,x为自变量。在机器学习中y是标签,x是特征。1.2 ...原创 2020-04-14 22:51:14 · 1109 阅读 · 0 评论 -
ID3决策树
一、基本概要决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。Entropy = 系统的凌乱程度,使用算法ID3, ...原创 2020-04-12 21:06:03 · 1556 阅读 · 0 评论 -
k-近邻算法
一、基本概念K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。 ...原创 2020-04-12 20:39:16 · 772 阅读 · 0 评论 -
Python自己下载安装snownlp
1.下载地址:https://pypi.org/project/snownlp/0.12.3/2.安装:将下载好的文件进行解压,这里我直接解压到了桌面。然后打开命令窗口,进入解压目录,输入python setup.py install如下图所示:...原创 2020-04-08 21:10:15 · 5178 阅读 · 0 评论 -
python之递归函数
面试题:递归打印Fibonacci数列1,1,2,3,5,8,13非递归算法:算法a,ba=bb=a+bdef fib(n): if n==1 or n==2: return 1 a=1 b=1 for i in range(n-2): temp=a+b a=b b=temp ret...原创 2020-01-16 13:58:08 · 217 阅读 · 0 评论 -
Scrapy库安装解决方法
用管理员身份运行cmd,输入pip install scrapy,安装失败!然后百度得出Scrapy库安装时更改镜像源就可以直接安装成功,又快又省力pip install scrapy -i https://pypi.tuna.tsinghua.edu.cn/simple...原创 2020-01-02 18:36:13 · 165 阅读 · 0 评论 -
用requests和re库爬取淘宝信息
步骤:导入必要的requests和re库。使用requests库获取淘宝搜索页面的代码内容,其中使用curl.trillworks.com神器访问页面源码使用re库对搜索页面中的内容进行搜索匹配,获取想要的商品名称和价格信息将获取的信息全部打印出来设置请求头header,这样才可以伪装成浏览器用谷歌浏览器打开淘宝,用关键词“手机”搜索后,按F12进入检查,查看Net...原创 2020-01-02 17:46:49 · 1416 阅读 · 0 评论 -
简单爬取大学排名
import requestsimport bs4from bs4 import BeautifulSoupurl = 'http://www.zuihaodaxue.cn/zuihaodaxuepaiming2019.html'def main(): uinfo = [] html = getHTMLText(url) fillUnivList(uinfo, h...原创 2019-12-27 18:46:19 · 130 阅读 · 0 评论 -
简单爬取一张图片
import requestsimport osurl="http://img0.dili360.com/ga/M02/49/B7/wKgBzFqo8ySAT4nUAAry7yQ0MW4188.tub.jpg@!rw17"root="F://pics//"path=root+url.split('/')[-1]try: if not os.path.exists(root): ...原创 2019-12-26 19:28:41 · 368 阅读 · 0 评论 -
客户价值-RFM聚类分析
一、数据读取import pandas as pddata=pd.read_excel('RFM聚类分析.xlsx',index_col='用户编码')data.head()二、数据探索及预处理data.describe(include='all')数据提取日为2016/07/20from datetime import datetimeex_data=datetime(2...原创 2019-12-18 13:14:18 · 1036 阅读 · 0 评论 -
上海二手房价数据分析
目的:本篇给大家介绍一个数据分析的初级项目,目的是通过项目了解如何使用Python进行简单的数据分析。数据源:博主通过爬虫采集的安X客上海二手房数据,由于能力问题,只获取了2160条数据。数据初探首先导入要使用的科学计算包numpy,pandas,可视化matplotlib,seabornimport numpy as npimport seaborn as snsimport m...原创 2019-11-07 15:48:11 · 2198 阅读 · 2 评论