自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 资源 (3)
  • 收藏
  • 关注

原创 机器学习----决策树

一、提纲

2018-06-30 15:20:36 521

原创 可视化库----Matplotlib+Pyecharts 高级篇及应用

1、柱状图import pyechartsfrom pyecharts import Barbar = Bar("我的第一个图表", "这里是副标题")#pyecharts先定义,再进行展示bar.add("服装",

2018-06-29 12:55:02 5760

原创 Jupyter notebook转化为网页的方法

本人在写一个项目的时候就想,一个jupyter notebook内容那么多,要是能做成网页潜入到博客中,能省下不少时间,自己也摸索了蛮长时间的,给大家分享一下~ 有关jupyter notebook转化的其他格式的用法以及Github的详情用法,之后会详细分博客介绍,今天先讲转化为网页的      &amp

2018-06-28 21:16:58 7817 2

原创 可视化库----Matplotlib+Pandas高级篇及应用

一、柱状图详解import matplotlib.pyplot as pltimport numpy as npplt.rcParams["font.sans-serif"]=['SimHei'] # 用于正常显示中文标签plt.rcParams['axes.unicode_minus']=False # 用来正

2018-06-27 18:46:51 5897 2

原创 爬虫----网易云音乐Top250的数据歌词信息的连续爬取

一、新建一个项目二、在items.py文件中写入需要爬取的信息三、在spiders.py文件中新建一个py文档,写基础爬虫的文件四、准备好保存的文件的位置,路径五、在setting.py文件中修改头部,修改默认ITEM_PIPELINES的保存类,改为自定的类六、在singer中创建一个主要运行文件 需要获得的数据有歌手,歌名,加上连接 歌词单独保存到tx...

2018-06-26 18:10:49 653

原创 可视化库----Matplotlib进阶篇

一、进阶1.1创建三角函数及重构import matplotlib.pyplot as pltimport numpy as npx = np.linspace(-np.pi,np.pi,256,endpoint=True)C = np.cos(x)S = np.sin(x)plt.plot(x,C)plt.plot(x,S)plt.show()1.2 重构1 线条...

2018-06-26 16:16:49 729

原创 可视化库----Matplotlib入门+基础

一、基础美化#-*-coding:utf-8-*-import matplotlib.pyplot as pltplt.rcParams['font.sans-serif']= ['SimHei'] #中文注释plt.rcParams['axes.unicode_minus'] = False #显示正负号x = [1,2,5]y = [5,4,2]x2 = [1,3,5]...

2018-06-26 12:33:38 511

原创 科学数据库----Matplotlib+Pandas小练习(持续更新)

一、数据加载文件夹点击这里### Step 1. 导入相应的模块from pandas import DataFrame,Seriesimport pandas as pdimport numpy as np#Step 2. 加载文件pd.read_csv("datasets/users.csv",sep='|')### Step 3. 将加载的数据集赋值给变量users....

2018-06-26 11:17:08 936 1

原创 科学数据库----Pandas高级篇

1、数据归整化1.1数据合并

2018-06-26 10:45:49 709

原创 机器学习----K最近邻(KNN)

一、什么是K近邻 K最近邻(k-Nearest Neighbour,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 用官方的话来说,所谓K近邻算法,即是给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的...

2018-06-23 19:45:46 751

原创 机器学习----逻辑回归

一、概念1、什么是逻辑回归?逻辑回归就是这样的一个过程:面对一个回归或者分类问题,建立代价函数,然后通过优化方法迭代求解出最优的模型参数,然后测试验证我们这个求解的模型的好坏。Logistic回归虽然名字里带“回归”,但是它实际上是一种分类方法,主要用于两分类问题(即输出只有两种,分别代表两个类别)回归模型中,y是一个定性变量,比如y=0或1,logistic方法主要应用于研究某些...

2018-06-23 15:58:43 595 1

原创 机器学习----数据准备&特征工程(2)

一、数据降维

2018-06-22 17:17:20 687

原创 机器学习----数据准备&特征工程(1)

一、总介绍二、用户RFM行为特征提取import pandas as pdfrom IPython.core.interactiveshell import InteractiveShellInteractiveShell.ast_node_interactivity= "all"##导入交易数据类型trade = pd.read_csv(&am

2018-06-22 17:17:01 873

原创 科学数据库----Pandas基础+进阶

1、学习路线2、数据查看

2018-06-22 10:49:49 907

原创 机器学习----scikit-learn入门

1、优点

2018-06-14 19:08:36 817

原创 数学必知必会---概率论

一、必备工具统计学概念 分为: 描述统计学和推断统计学,前者范围小,后来是按照一些数据推断整体的特征

2018-06-13 20:28:23 680

原创 数学必知必会----无穷级数

1

2018-06-13 17:42:51 585

原创 数学必知必会----极限与连续函数

一、极限 基于符号的运算 import sympy,math math.sqrt(2)**2 sympy.sqrt(2)**2 上面会有误差,用sympy就不会有误差运算规则

2018-06-12 19:39:03 515

原创 数学必知必会----导数、梯度与积分

from sympy import *x=Symbol("x")diff(x**3 + x**2)#3x**2 + 2**x一、导数 导数的实质就是曲线切线的斜率1.1常用的倒数 1.2复合函数求导1.2.1链式法则1.2.2多元函数求导:偏导数(偏微分) 链式法则 多元函数求导的法则 二、积分...

2018-06-12 19:18:22 4791

原创 数学必知必会----矩阵及线性变换

1加减乘法 2矩阵与向量的乘法2.1例2.2用矩阵把三维向量转换成2维的向量3单位矩阵4线性变换4.1伸缩4.2旋转5 SVD奇异值5.1 SVD奇异值分解5.2 SVD奇异值降维/去噪6转置矩阵7正交矩阵8行列式8.1 二阶行列式8...

2018-06-11 20:03:03 491

原创 数学必知必会----向量

比较简单,就介绍下要用的知识1、向量 向量是有长度的方向的线段 长度为0 的向量,叫做零向量 可以认为零乡里nag的方向是任意的2、向量的投影计算向量的投影3、向量的内积向量的点积 4、相似度4.1cos相似度import numpy as npfrom numpy import linalg a...

2018-06-11 19:28:52 463

原创 Scrapy+Selenium---进阶用法+高级

一、Scrapy爬取某网页的音乐的各个信息 在所需的文件中所在命令窗口创建一个项目步骤1、在items文件中写入需要的类import scrapyfrom scrapy import Field,Itemclass TestwangyiItem(scrapy.Item): # define the fields for your item here like...

2018-06-11 16:28:17 4311 4

原创 Scrapy----安装及基础案例

一、安装步骤 1 在所需要的路径中安装 第一步安装lxml 利用pip install lxml lxml是个非常有用的python库,它可以灵活高效地解析xml,与BeautifulSoup、requests结合,是编写爬虫的标准姿势。 2第二步安装zope.interface pip install zope.interface Python...

2018-06-10 21:24:50 393

原创 爬虫---基础语法及案例 py-2

#-*-coding:utf-8-*-import reimport urllib2import randomimport chardetimport xlwt#l拉取网页内容def getHtml(url): USER_AGENTS = [] #伪装头部信息的列表 proxies = [] #伪装IP的列表 req = urllib2.Requ...

2018-06-07 16:07:14 391

原创 爬虫----基础语法及案例 Py-3

#导入urllib2模块 (python2.7)# py2+urllib2结合urllib=>py3 urllibimport urllib#(在此是py3 环境)from urllib import requestreq=request.Request('http://www.baidu.com') #1设置url地址 https信息量较少,信息会加密若是http格...

2018-06-07 15:54:21 1553

spark练习数据

spark练习数据spark练习数据spark练习数据spark练习数据

2018-07-30

Hive集成Python分析数据

Hive;Hive;Hive;Hive;Hive;Hive;Hive;Hive;Hive;Hive;Hive;Hive

2018-07-26

pandas+matplotlib练习数据

练习数据~练习数据~练习数据~练习数据~练习数据~练习数据~练习数据~练习数据~练习数据~练习数据~

2018-07-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除