Python
文章平均质量分 95
JeemyJohn
这个作者很懒,什么都没留下…
展开
-
Scikit-learn实战之线性模型
下面是一系列的用于回归的方法,这些方法的目标值(target value)是由输入变量的线性组合而成。在数学概念上,如果 y^\hat y 是预测值: 在整个模块中,我们指定向量 为系数,并且 ω0\omega_0 作为截距。1. 普通最小二乘法 LinearRegression是一个线性模型,它的系数 最小化数据集中的观测结果和线性预测结果之间的残差和。它解决的问题在数学上可以形式原创 2016-12-10 21:15:01 · 1342 阅读 · 11 评论 -
Sckit-learn之朴素贝叶斯
1. 朴素贝叶斯方法概述 朴素贝叶斯方法是一系列有监督学习算法组成的,这些算法基于应用贝叶斯理论并带有“naive”的假设:所有特征之间两两独立。给定一个类变量 yy 和一个独立的特征向量集 x1x_1 到 xnx_n。贝叶斯理论阐述如下的关系式: ![这里写图片描述](http://scikit-learn.org/stable/_images/math/475原创 2016-12-04 18:30:49 · 1782 阅读 · 4 评论 -
python --网页爬虫,文本处理,科学计算,机器学习,数据挖掘资料+附带工具包下载
Python网页爬虫工具: Scrapy Scrapy, a fast high-level screen scraping and web crawling framework for Python. 不少同学肯定有耳闻,依靠Scrapy抓取了不少课程图谱,有关的文章有很多,大牛pluskid以前写过一篇文章:《Scrapy 轻松定制网络爬虫》,久经考验。 官网:http://scr转载 2016-12-24 18:19:10 · 1432 阅读 · 9 评论 -
Windows下安装Scikit-Learn
用Python做机器学习,最常用的库就是scikit-learn。接下来,我就介绍一下如何在Windows中安装并成功运行scikit-learn。1. 安装Python 首先,我们需要安装Python环境。本人选择的是64位版本的Python 3.5。去Python官网https://www.python.org/选择相应的版本并下载。如下如所示:接下来安装,并最终选择将Python加原创 2017-04-22 15:15:15 · 11048 阅读 · 17 评论 -
Sckit-learn之数据预处理
1. 数据预处理在机器学习中的重要性 在Scikit-learn中的sklearn.preprocessing包提供了一些公共的实用函数和转换类来将特征行向量转换成更适合于接下来的估计的表示。 对于Scikit-learn中实现的许多机器学习估计来说,对数据集进行规范化是一个通用的需求。如果个别的特征或多或少的不服从与通常的数据分布:例如标准正态分布(均值为0,方差为1),这原创 2016-11-29 22:46:59 · 1767 阅读 · 4 评论 -
机器学习核心算法各个击破
0. 前言 近年来,随着 Google 的 AlphaGo 打败韩国围棋棋手李世乭之后,机器学习尤其是深度学习的热潮席卷了整个IT界。所有的互联网公司,尤其是 Google 微软,百度,腾讯等巨头,无不在布局人工智能技术和市场。百度,腾讯,阿里巴巴,京东,等互联网巨头甚至都在美国硅谷大肆高薪挖掘人工智能人才。现在在北京,只要是机器学习算法岗位,少则月薪 20k,甚至100k 以上…… ...原创 2018-04-28 20:08:20 · 1795 阅读 · 0 评论 -
Python计算相关性
计算相关性import numpy as npimport pandas as pd# load datadata = pd.read_csv('result.csv', header=0)print(data)df = data.drop(['experiment'], axis=1)# 计算不同的相关系数corr = df.corr(method='pearson')p...原创 2018-11-14 14:35:48 · 2401 阅读 · 0 评论