数据分析
文章平均质量分 70
加码未来-杨老师
这个作者很懒,什么都没留下…
展开
-
数据分析(一)
数据分析应用于各个领域,作为一个Python的程序员,又怎么能不知道数据分析呢。学好数据分析才能学好机器学习,进而才能学习人工智能,我们一起来了解下数据分析吧。一.启动程序执行命令:jupyter notebook浏览器地址为:http://localhost:8888/通过control—C终止jupyter程序几个基本操作:1.双击D:删除当前cell2.单击M:转为markd...原创 2018-11-14 19:58:57 · 326 阅读 · 0 评论 -
Tableau Desktop安装说明
先附上下载链接: https://pan.baidu.com/s/1PQktH6SPA-t1w9GHyztG7Q 密码:s7x0Tableau Desktop破解说明1.下载完Tableau Desktop for Mac破解版安装包后,打开软件包,双击软件【Tableau Desktop】到应用程序进行安装.2.进入Tableau Desktop Mac安装界面,点击【继续】3.了解下...转载 2018-11-30 09:53:54 · 2831 阅读 · 3 评论 -
数据分析项目总结
1.立项作为一个合作项目,我们希望双方都能从项目中有所收益,对各自的工作生活能有实际帮助,过程很纠结, 反转了几次:a.开始想了解公众号的现状。从搜索公众号的分析开始,随着调研的深入,发现已经有网站对公众号做了各种排行,数据详尽,品类齐全,但真正有价值可以做分析的数据,比如关注公众号的读者数据似乎很难获得。b.转而浏览了很多公开的数据源,想把重点放在数据分析上。海量数据,既多且杂,感兴趣...转载 2018-11-29 15:40:42 · 5301 阅读 · 0 评论 -
数据分析(五)
周末,终于闲了下来。突然想起数据分析的知识还没整理完。好吧,废话就不多说了,我们继续总结相关的知识点。前面学了series和dataframe,今天我们先说说他们的运算:【重要】使用Python操作符:以行为单位操作,对所有行都有效。(类似于numpy中二维数组与一维数组的运算,但可能出现NaN)使用pandas操作函数:axis=0:以列为单位操作(参数必须是列),对所有列都有效。a...原创 2018-11-17 11:22:13 · 257 阅读 · 0 评论 -
Python 朴素贝叶斯的算法
朴素贝叶斯算法python实现朴素贝叶斯是一种十分简单的分类算法,称其朴素是因为其思想基础的简单性,就文本分类而言,他认为词袋中的两两词之间的关系是相互独立的,即一个对象的特征向量中的每个维度都是互相独立的。这是朴素贝叶斯理论的思想基础。朴素贝叶斯分类的正式定义:设x={}为一个待分类项,而每个a为x的一个特征属性有类别集合C={}计算P(|x),P(|x),…,P(|x)如果P(|x...原创 2018-11-19 17:43:52 · 401 阅读 · 0 评论 -
数据分析(十四)
交叉验证 (用鸢尾花数据集作为示例)from sklearn.datasets import load_irisiris = load_iris()data = iris.data #数据target = iris.target #特征值# 交叉验证 把数据集分成 不同的训练集 和 测试集 然后多次测算模型的准确率# cross_val cross validate 交叉验证...原创 2018-11-22 15:21:45 · 276 阅读 · 0 评论 -
数据分析(十三)
练习:图片压缩导入三剑客:import numpy as npimport pandas as pdfrom matplotlib.pyplot as plt如果从 0-255这256(16x16)种颜色 中 抽取出 16种(4x4)则在保存的时候 如果是保存成png格式的图片 图片的元数据中会自动建立颜色索引 从而压缩数据量# 128*128个像素点# 压缩前 r g b三种颜...原创 2018-11-21 16:56:42 · 307 阅读 · 0 评论 -
数据分析(十)
线性回归岭回归1、原理# 线性回归可以求解 各个特征的权重# 但是如果特征比样本还多 这个时候用线性回归就无法求解了# 三元一次方程组y1 = w1*x11 + w2*x21 + w3*x31y2 = w1*x12 + w2*x22 + w3*x32y3 = w1*x13 + w2*x23 + w3*x331 2 32 4 64 8 12102040w1...原创 2018-11-20 21:39:40 · 492 阅读 · 0 评论 -
数据分析(十一)
Day11朴素贝叶斯现分别有 A、B 两个容器,在容器 A 里分别有 7 个红球和 3 个白球,在容器 B 里有 1 个红球和 9 个白球,现已知从这两个容器里任意抽出了一个球,且是红球,问这个红球是来自容器 A 的概率是多少?设 球来自A容器是 事件A 来自容器A的概率是 P(A) = 1/2设 球是红球 是 事件B 球是红球的概率 P(B) = 8/20已知是红球的前提下 来...原创 2018-11-20 20:46:52 · 937 阅读 · 0 评论 -
数据分析(十二)
支持向量机SVM(Support Vector Machine)【关键字】支持向量,最大几何间距一、支持向量机的原理Support Vector Machine 支持向量机,其含义是通过支持向量运算的分类器。其中“机”的意思是机器,可以理解为分类器。那么什么是支持向量呢?在求解的过程中,会发现只根据部分数据就可以确定分类器,这些数据称为支持向量。在一个二维环境中,其中点R,S,G点和其他靠...原创 2018-11-20 20:02:08 · 330 阅读 · 0 评论 -
数据分析(四)
之前我们学习了numpy,pandas。现在能自己引入数据分析的三剑客不?试一试吧,想不起来,就要看看前面的呦。来吧,我们一起导入一下吧!import numpy as npimport pandas as pdfrom pandas import Series,DataFrameimport matplotlib as plt导入包之后,现在我们就要进行下面的步骤了,想一想要怎样产...原创 2018-11-14 21:00:12 · 341 阅读 · 0 评论 -
数据分析(三)
Pandas的数据结构导入pandas:数据分析三剑客 numpy pandas matplotlib# 三剑客import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom pandas import Series,DataFrame1、SeriesSeries是一种类似于一维数组的对象,由下面...原创 2018-11-14 20:01:41 · 332 阅读 · 0 评论 -
数据分析(二)
Numpy:Numeric Python引言:要学好机器学习,先打好数据分析的基础,打好基础才能实现后面那些经验的功能一、导入导入:import numpy as np查看版本:np.__ version __二、数组ndarray1、使用np.array()import numpy as nptest=np.array([1,2,3,4,5])test2、创建多维数组2....原创 2018-11-14 20:00:58 · 882 阅读 · 0 评论 -
数据分析项目(一)——爬虫篇
想做一个数据分析的项目,需要数据,刚好前些天学了爬虫,突然想自己爬取数据了,我爬取的是前程无忧网。用的是scrapy框架爬取的。下面是代码:首先是创建工程:scrapy startproject 工程名我的是:scrapy startproject job1进入工程:cd job1在工程目录下创建项目:scrapy genspider 项目名 项目网址scrapy genspider 5...原创 2018-11-30 10:38:03 · 3079 阅读 · 0 评论