2018年06月_sakura小樱

12月 11月 10月 08月 07月 06月 05月

原创可视化库----Matplotlib+Pyecharts 高级篇及应用

1、柱状图import pyechartsfrom pyecharts import Barbar = Bar(&amp;amp;quot;我的第一个图表&amp;amp;quot;, &amp;amp;quot;这里是副标题&amp;amp;quot;)#pyecharts先定义，再进行展示bar.add(&amp;amp;quot;服装&amp;amp;quot;,

2018-06-29 12:55:02 5760

原创 Jupyter notebook转化为网页的方法

本人在写一个项目的时候就想，一个jupyter notebook内容那么多，要是能做成网页潜入到博客中，能省下不少时间，自己也摸索了蛮长时间的，给大家分享一下~ 有关jupyter notebook转化的其他格式的用法以及Github的详情用法，之后会详细分博客介绍，今天先讲转化为网页的 &amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp

2018-06-28 21:16:58 7817 2

原创可视化库----Matplotlib+Pandas高级篇及应用

一、柱状图详解import matplotlib.pyplot as pltimport numpy as npplt.rcParams[&amp;amp;amp;amp;amp;amp;amp;amp;quot;font.sans-serif&amp;amp;amp;amp;amp;amp;amp;amp;quot;]=['SimHei'] # 用于正常显示中文标签plt.rcParams['axes.unicode_minus']=False # 用来正

2018-06-27 18:46:51 5897 2

原创爬虫----网易云音乐Top250的数据歌词信息的连续爬取

一、新建一个项目二、在items.py文件中写入需要爬取的信息三、在spiders.py文件中新建一个py文档，写基础爬虫的文件四、准备好保存的文件的位置，路径五、在setting.py文件中修改头部，修改默认ITEM_PIPELINES的保存类，改为自定的类六、在singer中创建一个主要运行文件需要获得的数据有歌手，歌名，加上连接歌词单独保存到tx...

2018-06-26 18:10:49 653

原创可视化库----Matplotlib进阶篇

一、进阶1.1创建三角函数及重构import matplotlib.pyplot as pltimport numpy as npx = np.linspace(-np.pi,np.pi,256,endpoint=True)C = np.cos(x)S = np.sin(x)plt.plot(x,C)plt.plot(x,S)plt.show()1.2 重构1 线条...

2018-06-26 16:16:49 729

原创可视化库----Matplotlib入门+基础

一、基础美化#-*-coding:utf-8-*-import matplotlib.pyplot as pltplt.rcParams['font.sans-serif']= ['SimHei'] #中文注释plt.rcParams['axes.unicode_minus'] = False #显示正负号x = [1,2,5]y = [5,4,2]x2 = [1,3,5]...

2018-06-26 12:33:38 511

原创科学数据库----Matplotlib+Pandas小练习(持续更新)

一、数据加载文件夹点击这里### Step 1. 导入相应的模块from pandas import DataFrame,Seriesimport pandas as pdimport numpy as np#Step 2. 加载文件pd.read_csv(&quot;datasets/users.csv&quot;,sep='|')### Step 3. 将加载的数据集赋值给变量users....

2018-06-26 11:17:08 936 1

原创科学数据库----Pandas高级篇

1、数据归整化1.1数据合并

2018-06-26 10:45:49 709

原创机器学习----K最近邻（KNN）

一、什么是K近邻 K最近邻(k-Nearest Neighbour，KNN)分类算法，是一个理论上比较成熟的方法，也是最简单的机器学习算法之一。该方法的思路是：如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别。用官方的话来说，所谓K近邻算法，即是给定一个训练数据集，对新的输入实例，在训练数据集中找到与该实例最邻近的...

2018-06-23 19:45:46 751

原创机器学习----逻辑回归

一、概念1、什么是逻辑回归？逻辑回归就是这样的一个过程：面对一个回归或者分类问题，建立代价函数，然后通过优化方法迭代求解出最优的模型参数，然后测试验证我们这个求解的模型的好坏。Logistic回归虽然名字里带“回归”，但是它实际上是一种分类方法，主要用于两分类问题（即输出只有两种，分别代表两个类别）回归模型中，y是一个定性变量，比如y=0或1，logistic方法主要应用于研究某些...

2018-06-23 15:58:43 595 1

原创机器学习----数据准备&特征工程（2）

一、数据降维

2018-06-22 17:17:20 687

原创机器学习----数据准备&特征工程（1）

一、总介绍二、用户RFM行为特征提取import pandas as pdfrom IPython.core.interactiveshell import InteractiveShellInteractiveShell.ast_node_interactivity= &amp;amp;amp;amp;amp;quot;all&amp;amp;amp;amp;amp;quot;##导入交易数据类型trade = pd.read_csv(&am

2018-06-22 17:17:01 873

原创科学数据库----Pandas基础+进阶

1、学习路线2、数据查看

2018-06-22 10:49:49 907

原创机器学习----scikit-learn入门

1、优点

2018-06-14 19:08:36 817

原创数学必知必会---概率论

一、必备工具统计学概念分为：描述统计学和推断统计学,前者范围小，后来是按照一些数据推断整体的特征

2018-06-13 20:28:23 680

原创数学必知必会----无穷级数

2018-06-13 17:42:51 585

原创数学必知必会----极限与连续函数

一、极限基于符号的运算 import sympy,math math.sqrt(2)**2 sympy.sqrt(2)**2 上面会有误差，用sympy就不会有误差运算规则

2018-06-12 19:39:03 515

原创数学必知必会----导数、梯度与积分

from sympy import *x=Symbol(&amp;amp;quot;x&amp;amp;quot;)diff(x**3 + x**2)#3x**2 + 2**x一、导数导数的实质就是曲线切线的斜率1.1常用的倒数 1.2复合函数求导1.2.1链式法则1.2.2多元函数求导：偏导数（偏微分）链式法则多元函数求导的法则二、积分...

2018-06-12 19:18:22 4791

原创数学必知必会----矩阵及线性变换

1加减乘法 2矩阵与向量的乘法2.1例2.2用矩阵把三维向量转换成2维的向量3单位矩阵4线性变换4.1伸缩4.2旋转5 SVD奇异值5.1 SVD奇异值分解5.2 SVD奇异值降维/去噪6转置矩阵7正交矩阵8行列式8.1 二阶行列式8...

2018-06-11 20:03:03 491

原创数学必知必会----向量

比较简单，就介绍下要用的知识1、向量向量是有长度的方向的线段长度为0 的向量，叫做零向量可以认为零乡里nag的方向是任意的2、向量的投影计算向量的投影3、向量的内积向量的点积 4、相似度4.1cos相似度import numpy as npfrom numpy import linalg a...

2018-06-11 19:28:52 463

原创 Scrapy+Selenium---进阶用法+高级

一、Scrapy爬取某网页的音乐的各个信息在所需的文件中所在命令窗口创建一个项目步骤1、在items文件中写入需要的类import scrapyfrom scrapy import Field,Itemclass TestwangyiItem(scrapy.Item): # define the fields for your item here like...

2018-06-11 16:28:17 4311 4

原创 Scrapy----安装及基础案例

一、安装步骤 1 在所需要的路径中安装第一步安装lxml 利用pip install lxml lxml是个非常有用的python库，它可以灵活高效地解析xml，与BeautifulSoup、requests结合，是编写爬虫的标准姿势。 2第二步安装zope.interface pip install zope.interface Python...

2018-06-10 21:24:50 393

原创爬虫---基础语法及案例 py-2

#-*-coding:utf-8-*-import reimport urllib2import randomimport chardetimport xlwt#l拉取网页内容def getHtml(url): USER_AGENTS = [] #伪装头部信息的列表 proxies = [] #伪装IP的列表 req = urllib2.Requ...

2018-06-07 16:07:14 391

原创爬虫----基础语法及案例 Py-3

#导入urllib2模块（python2.7）# py2+urllib2结合urllib=&amp;amp;amp;amp;amp;gt;py3 urllibimport urllib#（在此是py3 环境）from urllib import requestreq=request.Request('http://www.baidu.com') #1设置url地址 https信息量较少，信息会加密若是http格...

2018-06-07 15:54:21 1553

spark练习数据

spark练习数据spark练习数据spark练习数据spark练习数据

2018-07-30

Hive集成Python分析数据

Hive;Hive;Hive;Hive;Hive;Hive;Hive;Hive;Hive;Hive;Hive;Hive

2018-07-26

pandas+matplotlib练习数据

练习数据~练习数据~练习数据~练习数据~练习数据~练习数据~练习数据~练习数据~练习数据~练习数据~

2018-07-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

樱花落瓣

原创机器学习----决策树