自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(49)
  • 资源 (10)
  • 收藏
  • 关注

原创 Numpy中concatenate与tile函数详解

concatenate((a1,a2,...),axis=0)实现numpy中数据多个数组(a1,a2,...)的拼接,axis=0沿着垂直方向,axis=1沿着水平方向。In [245] a=np.array([[1, 2, 4, 5]]) b=np.array([[3, 4, 6, 7]]) print('Horizontal \...

2019-04-26 21:56:54 921

原创 Numpy中vstack与hstack函数源码

vstack与hstack函数Numpy中用来拼接数组的基础函数。vstack( vertical stack):将多个数组沿竖直方向拼接 hstack( horizontal stack):将多个数组沿水平方向拼接In [137] a=np.array([[1, 2, 4, 5],[1, 2, 4, 5]]) b=np.array([[3, 4, 6,...

2019-04-25 22:38:14 349

原创 Numpy中reshape函数、reshape(1,-1)的含义(浅显易懂,源码实例)

本文详细介绍numpy中reshape函数的三种常见相关用法。一般用法:numpy.arange(n).reshape(a, b); 依次生成n个自然数,并且以a行b列的数组形式显示:In [1]: np.arange(16).reshape(2,8) #生成16个自然数,以2行8列的形式显示Out[1]: array([[ 0, 1, 2, 3, 4, 5, 6, ...

2018-08-27 16:34:19 28867 2

原创 Pandas中loc和iloc函数用法详解(源码+实例)

loc函数:通过行索引 "Index" 中的具体值来取行数据(如取"Index"为"A"的行)iloc函数:通过行号来取行数据(如取第二行的数据)本文给出loc、iloc常见的五种用法,并附上详细代码。1. 利用loc、iloc提取行数据import numpy as npimport pandas as pd#创建一个Dataframedata=pd.DataFrame(...

2018-08-04 15:55:40 163826 26

原创 MYSQL查询表格数据基本操作指南

这篇博客旨在更详细简洁的介绍MYSQl中查询数据的相关基本操作,包括单张表格查询数据、使用聚合函数查询数据、连接多个表格查询数据、子查询语句、合并查询语句以及表或字段别名操作。MYSQL表格基本处理操作参考本人博文:https://blog.csdn.net/W_weiying/article/details/80496616,推荐大家使用工具SQLyog(下载地址https://download...

2018-06-02 22:42:44 5055 2

原创 Python字符串:join与format函数

str.join(): 将字符插入对象中间返回一个长字符串In [1]: print(' and '.join(['Mary'])) print(' and '.join(['Mary','John'])) print(' and '.join(['Mary','John','Amy']))Out [1]: Mary Mary a...

2019-07-27 15:55:57 843

原创 MYSQL中导入Excel文件

本文阐述了一般情况下怎么在mysql中导入excel文件,作者借助工具sqlyog,也可以直接在mysql中操作。主要步骤:第一步:首先将excel文件打开另存为csv文件再将其用Notepad打开,将编码改成utf-8保存第二步:先建立数据库列名一致的表格,可参考博客,本文用sqlyog创建,也可直接在mysql里面创建再写导入sqlLOAD DATA IN...

2019-04-01 14:50:30 13041 3

原创 Pandas数据去重:drop_duplicates函数详解

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)参数解释:subset: 列名,默认所有的列 keep: 是否保留{‘first’, ‘last’, False},keep= 'first' 表示去重时每组重复数据保留第一条数据,其余数据丢弃; keep='last' 表示去重时每组重复数据保留最后一条...

2019-01-15 15:49:57 5502

原创 A value is trying to be set on a copy of a slice from a DataFrame

最近在做数据分析的时候,发现在Dataframe中插入一列之后会报这个错误A value is trying to be set on a copy of a slice from a DataFrame.Try using .loc[row_indexer,col_indexer] = value instead源数据如下:In [158]:dataOut[158]: ...

2018-12-25 14:46:42 4509

原创 Pandas 中Dataframe数据插入: Insert函数 详解

Dataframe.insert(loc, column, value, allow_duplicates=False): 在Dataframe的指定列中插入数据。参数介绍:       loc:  int型,表示第几列;若在第一列插入数据,则 loc=0       column: 给插入的列取名,如 column='新的一列'       value:数字,array,seri...

2018-12-25 14:44:19 23659

原创 Pandas中at、iat函数详解

at 函数:通过行名和列名来取值(取行名为a, 列名为A的值)iat 函数:通过行号和列号来取值(取第1行,第1列的值)本文给出at、iat常见的用法,并附上详细代码。1. 首先创建一个DataFrame(data)Out[1]: pd.DataFrame(np.arange(15).reshape(5,3), columns=list('ABC'), index=list('a...

2018-12-04 14:12:18 3773 2

原创 Pandas: Drop函数(Dataframe删除指定行列)

isin函数  (请点击链接:isin函数提取和删除Dataframe指定行列)更多原创PYTHON数据分析博文,请关注博文专栏(超链接:PYTHON数据分析) 本文介绍主要结介绍用Drop函数删除Dataframe指定行列:drop(labels=None, axis=0, index=None, columns=None,             level=None, in...

2018-11-29 14:45:53 20983 2

原创 Pandas中isin函数 Dataframe提取(删除)指定行列

本文介绍主要结介绍用isin函数提取和删除Dataframe指定行列:isin函数(条件前加~表示isin函数的逆函数)1. 返回含有具体条件的dataframe, 如返回 'A'列中含有 [4,8] 的dataframe( 用逆函数对筛选后的结果取余,起删除指定行作用 )IN [1]: dataOut[1]: A B C D0 0 1 2 31 ...

2018-11-29 11:56:11 12235 1

原创 List快速去重(Python)

利用Set函数函数(set() 函数创建一个无序不重复元素集,可进行关系测试,删除重复数据,还可以计算交集、差集、并集等)In [1]: test=[1,2,3,4,2,3]In [2]: set(test)Out [2]: {1, 2, 3, 4}In [3]: list(set(test))Out [3]: [1, 2, 3, 4] ...

2018-11-26 15:50:50 6769

原创 指定位置打开Jupyter Notebook

突然心血来潮,可能也是好久没更新博客了吧,回忆以前刚开始使用Jupyter的时候,也是一头雾水。今天跟一些刚开始用的朋友们分享一个很简单,但也很实用的技巧 "指定位置打开Jupyter Notebook"。建议安装 Anconda, 里面集成了 Jupyter Notebook.举例:一个excel文件在D盘中,路径:D:\python code\JupyterCode\test.xl...

2018-11-08 15:52:43 920

原创 Python3创建字典(Dict)的几种常规方法

1.常规创建字典In [1]: dict1 = {'a':1, 'b':2, 'c':3}In [2]: print(dict1)Out[2]: {'a': 1, 'b': 2, 'c': 3}2. 利用zip函数和 dict函数创建字典In [3]: list1 = ['a', 'b', 'c']; list2 = [1, 2, 3]; dict1 = dict(zip(l...

2018-10-15 15:28:22 6807 2

原创 Two Sum(python)两数相加

题目:Two Sum Given nums = [2, 7, 11, 15], target = 9, Because nums[0] + nums[1] = 2 + 7 = 9, return [0, 1].第一步:用 zip 函数做一个字典,将nums中数字与index联系起来:In [33]: dictionary = dict(zip(nums, li...

2018-10-09 17:14:25 446

原创 Pandas中multiindex转换成列

Multiindex格式如下:(a, b, c, ...),index column (a1,b1,c1) d1 (a2,b2,c2) d2 直接调用函数reset_index(),Multiindex中(a, b, c, ...)就变成columns了,index重置为(0,1,2,...), 如下:index       colum...

2018-09-10 14:59:25 5816

原创 Numpy中random.choice函数的用法举例

random.choice( list or array) 函数: 在list 或者 array中取一个数。In [1]: np.random.choice([1,2,3,4,5]) #随机选一个数字Out [1]: 2In [2]: np.random.choice([1,2,3,4,5]) #随机选一个数字Out [2]: 4In [3]: np.random.choi...

2018-08-27 19:53:04 1843

原创 Pandas将多个Sheet写入到本地同一Excel文件中

直接上代码import pandas as pd#读取两个表格data1=pd.read_excel('文件路径')data2=pd.read_excel('文件路径')#将两个表格输出到一个excel文件里面writer=pd.ExcelWriter('D:新表.xlsx')data1.to_excel(writer,sheet_name='sheet1')data2.t...

2018-08-06 14:41:36 10653 1

原创 Python读取XML中数据提取为Dataframe

对应的数据集为:<?xml version="1.0"?>-<opencv_storage> -<vocabulary type_id="opencv-matrix"> <rows>424</rows> <cols>512</cols> &

2018-08-03 11:59:21 4308

原创 Python提取TXT数据转化为DataFrame

第一步:读取文本,open函数第二步:处理文本,split函数第三步:利用Numpy, pandasimport pandas as pdimport numpy as np#打开txt文件file_object=open("D:/test.txt")try: file_content=file_object.read()finally: file_obje...

2018-08-02 16:14:44 16450

原创 Python利用置信区间进行数据清理

当我们利用python进行数据清理和筛选时,有时候一串数据的噪点很多,我们需要抽取一部分数据作为样本来进行分析,下面推荐一种基本的数据筛选方法,利用置信区间,例:样本满足正态分布。置信区间:当给出某个估计值的95%置信区间为 [a, b] 时,可以理解为有95%的信心可以说说样本的平均值介于a到b之间,而发生错误的概率为5%。计算方式:第一步:计算样本均值 第二步:计算样本标准差:...

2018-07-24 16:02:02 4040

原创 Tableau去除重复值

在工作表区域左边目录“记录数”右边选择编辑,输入下列函数{fixed A:countd(B)},在维度A下对指标B进行去重,即可去除重复值计数。

2018-07-19 10:36:53 12225

原创 Numpy中getA()/getA1()/getH()/getI()函数(源码实例)

  numpy中shape函数与tile函数1. getA()函数:将矩阵变成ndarray类型,或者使用 np.asarray()函数import numpy as npa=np.mat([[1,2],[3,4],[5,6]])aOut[32]: matrix([[1, 2], [3, 4], [5, 6]])a.getA()Out...

2018-07-16 11:54:24 1509

原创 Numpy中shape函数、tile函数

Knn与Kmeans算法中计算欧式距离多次出现这类函数,不免深入了解一下:numpy.shape(), 查看矩阵或者数组维度。import numpy as npa=np.array([1,2],[3,4],[5,6])a.shape[0]=3# 行a.shape[1]=2# 列numpy.tile(), 将数组按行或者列方向复制np.tile(a,2) #将矩阵沿着行复...

2018-07-16 10:52:46 206

原创 Dataframe指定列转化为矩阵matrix、数组list

废话不多说,直接上代码import numpy as npimport pandas as pd#创建数据框datadata=pd.DataFrame(np.arange(16).reshape(4,4),index=list('ABCD'),columns=list('EFGH'))''' E F G HA 0 1 2 3B 4 5 ...

2018-07-05 11:05:01 6923 3

原创 Windows中Anaconda(Python)与OpenCV进行配置

本文主要着重于详细的讲解Anaconda(python)与Opencv进行配置。感觉网上的配置教程较多,但是比较粗糙,适合有一定基础的人参考。博主也是刚刚入门,本博文旨在做一份详细,人人都可以看懂的配置教程。(浅蓝色字体为超链接)第一步:下载Anaconda,默认安装即可,可以参考安装教程Windows 安装 Anaconda3 详细过程,然后安装opencv:点击上图箭头处,然后再点击下图:下载...

2018-06-21 21:25:58 2711

原创 MYSQL数据库之索引

本篇博客旨在更详细简洁的介绍MYSQl索引的相关知识点,包括索引介绍、创建索引和删除索引。文中有详细的源代码作示例,可以粘贴到MYSQL直接运行。索引简介索引定义:索引是由数据库表中一列或者多列组合而成,其作用是提高对表中数据的查询速度;类似于图书的目录,方便快速定位,寻找指定的内容。索引的优缺点 :优点是提高查询数据的速度,缺点是增加了创建和维护索引的时间。索引分类 :普通索引:这类索引可以创建...

2018-06-09 22:07:22 382

原创 MYSQL修改插入删除表格数据

数据库博文汇总MYSQL查询表格数据基本操作指南MYSQL中编辑表格相关基本操作指南MYSQL修改插入删除表格数据本篇博客旨在更详细简洁的介绍MYSQl修改表格数据的相关基本操作,包括插入数据、修改数据和删除数据。文中有详细的源代码作示例,可以粘贴到MYSQL直接运行。插入数据首先创建一个空表格,id是唯一的,且自增长:USE `s_book`; DROP TABLE IF EXISTS `t...

2018-06-04 23:28:04 5603

原创 MYSQL中编辑表格相关基本操作指南

这篇博客旨在更详细简洁的介绍MYSQl中表格的相关基本操作,包括创建表格、查看表格、修改表格和删除表格。首先我们创建一个数据库,推荐先在记事本上面写,然后粘贴到MySQL命令行里面。mysql> create database s_book;创建表我们使用这个数据库,在这个数据库里面创建一个表格s_booktype,这个表格我们的需求是这样:包括 id (书的编号)、price (书的价格)...

2018-05-29 16:57:21 1098

原创 Pandas.cut函数用法及源码

数据分组:根据数据分析对象的特征,按照一定的数值指标,把数据分析对象划分为不同的区间部分来进行研究,以揭示其内在的联系和规律性。函数用法:cut(series, bins, right=True, labels=NULL), right=True表示分组右边闭合,right=False表示分组左边闭合,labels表示分组的自定义标签。import pandas;from pandas impo...

2018-05-21 19:54:31 6929

原创 Pandas之数据标准化

数据标准化:将数据按比例缩放,使之落入到特定区间,一般我们使用0-1标准化。公式:X=(x-min)/(max-min)from pandas import read_csv;df = read_csv("E:\\pythonlearning\\datacode\\firstpart\\4\\4.14\\data.csv");scale = (df.score-df.score.min()...

2018-05-21 19:34:55 5271

原创 Pandas之数据框运算

数据框的简单计算:直接对字段进行加减乘除运算:from pandas import read_csv;import pandas as pd;df = read_csv("E:\\pythonlearning\\datacode\\firstpart\\4\\4.13\\data.csv", sep="|");result = df.price*df.num#乘积result1 = d...

2018-05-21 16:57:19 2610

原创 Pandas.merge()函数用法及源码

字段匹配:将不同结构的数据框,按照一定的条件进行合并函数用法:merge(df1, df2, column of df1, column of df2)import pandas;from pandas import read_csv;items = read_csv( "E:\\pythonlearning\\datacode\\firstpart\\4\\4.12\\data1....

2018-05-21 16:39:29 1624

原创 Pandas数据框列合并详解

字段合并:将同一个数据框中的不同列,进行合并,形成新的列。函数用法:column=column1+column2+...from pandas import read_csv;import pandas as pddf= read_csv( "E://pythonlearning//datacode//firstpart//4//4.11//data.csv", sep="...

2018-05-21 16:24:30 6235

原创 Pandas.concat()函数用法及源码

记录合并:是指将两个结构相同的数据框,合并成一个数据框函数用法:concat([dataFrame1, dataFrame2, ...])import pandas;from pandas import read_csv;df1 = read_csv("E://pythonlearning//datacode//firstpart//4//4.10//data1.csv", sep="|")...

2018-05-21 12:31:48 1898

原创 Numpy.random.randint()函数用法及源码

随机抽样:随机从数据中,按照一定的行数或者比例抽取数据函数用法:numpy.random.randint(start, end, num)import numpy;from pandas import read_csv;import pandas as pddf = read_csv("E://pythonlearning//datacode//firstpart//4//4.9//data...

2018-05-21 12:20:23 9765

原创 Pandas数据库数据抽取

记录抽取:是指根据一定的条件,对数据进行抽取函数用法:dataframe[condition]import pandas;from pandas import read_csv;df = read_csv("E://pythonlearning//datacode//firstpart//4//4.8//data.csv", sep="|");df[df.comments>1000...

2018-05-21 11:46:44 1940

原创 python数据分析-DataFrame数据框常用基本知识(列、行、切片、计算等code)

 Python数据分析博文汇总Pandas重复值处理函数drop_duplicates() Pandas数据库缺失值处理函数dropna Pandas中slice函数字段抽取 python数据分析-DataFrame数据框基本知识 Pandas数据库数据抽取 Numpy.random.randint()函数用法及源码 Pandas.concat()函数用法及源码 Pandas...

2018-05-08 16:24:56 21310

scikit-learn cookbook (中文版)

scikit-learn cookbook (中文版), 文档中的代码可以直接复制运行。

2019-04-19

Pandas教程(cookbook)

pandas最新最全教程, 覆盖pandas所有的知识点。可以根据自身的需要,有选择性的阅读。文档代码可以直接复制运行。

2019-04-19

Matplotlib作图指南(高清PDF+内置源码)

Matplotlib 作图指南,高清PDF. 详细的介绍了如何Python利用Matplotlib进行可视化。 书本里面有详细的源码,可以直接粘贴复制运行。

2018-11-18

博文“MYSQL数据库之索引”对应的SQL

用SQLyog直接打开即可创建db_book数据库,SQLyog绿色下载地址:https://download.csdn.net/download/w_weiying/10442996 或者https://download.csdn.net/download/w_weiying/10463215

2018-06-06

SQLyog12.4绿色版

包含注册码,绿色无广告,直接解压安装运行即可,只要1分哦。

2018-06-06

sqlyog企业版v8.32(含注册码)

sqlyog企业版v8.32(含注册码),绿色直接解压打开运行即可。

2018-05-28

python数据分析博客源代码

对应我博客中文章的源代码,方便下载练习,代码直接解压到E盘就可以运行。

2018-05-21

SIS模型目标免疫mtalab源码

SIS模型的目标免疫mtalab源码:生成了无向的SIS模型,对模型植入了目标免疫策略。代码可以直接运行,先运行主程序,调动子程序。可以得到传染病的阈值和阈值随时间变化的曲线。

2018-05-08

机器学习+利用python进行数据分析

机器学习+利用python进行数据分析

2018-05-07

无标度BA模型matlab源码

无标度BA模型matlab源码, 含生成BA模型中的最大度,最小度,平均度,度分布

2018-04-04

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除