![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
FlizhN
这个作者很懒,什么都没留下…
展开
-
Python 输入多个经纬度坐标,找出中心点
根据工作需要,将多个坐标点的中心点找出,在stackoverflow中发现了一个解决方法,也有人提供了Python版本,但运行之后的结果却是几个带负号的小于1的小数,再观察其他版本的例子时发现需要将经纬度进行转化,将角度化为弧度就需用角度乘以π/180,反之就除以(π/180),所以在C#版本中就有//角度转弧度var latitude = geoCoordinate.Latitude * Math.PI / 180;var longitude = geoCoordinate.Longitude转载 2020-08-31 11:37:00 · 5366 阅读 · 1 评论 -
python计算两个坐标点之间的距离
背景:有几个门店和大厦,看看这几个门店和大厦旁边有没有快递柜数据:门店和大厦只有地址数据,快递柜系统有地址数据和经纬度数据类似的需求应该比较多,这里的核心点是关于两个坐标点之间距离的计算,之前没用过这个东西,刚好今天有个这样的需求,记录下。import requestsimport psycopg2import pandas as pdfrom math import radians, cos, sin, asin, sqrt #返回地址的坐标def get_address_co原创 2020-08-26 17:19:17 · 14701 阅读 · 0 评论 -
docx模块出现Import Error: No module named ‘exceptions‘
通过anaconda安装docx三方库,通过pip 命令直接安装的时候比较顺利,没有任何报错,但是在import的时候却出现了一些问题。Import Error: No module named 'exceptions'后来找资料发现是python3的兼容问题。那找一个能兼容的包安装就可以了!https://www.lfd.uci.edu/~gohlke/pythonlibs/找到python_docx-0.8.6-py2.py3-none-any.whl,点击下载到本地,然后通过pip进原创 2020-08-19 15:08:22 · 464 阅读 · 0 评论 -
多级列索引出现 ‘MultiIndex‘ object has no attribute ‘labels‘
在做一份分析报表的时候,所生产的DataFrame的列是多级索引的列,通过dataframe_to_rows将DataFrame转化为ws对象的时候,发现出现了数据的报错for r in dataframe_to_rows(df, index=False, header=True): ws.append(r)报错内容如下: 'MultiIndex' object has no attribute 'labels'通过源码,发现源码是这么写的,但是自己试了一下,发现我的版本并没与.原创 2020-08-05 15:26:55 · 4117 阅读 · 0 评论 -
python基础笔记(六)_数据清洗及建模
数据特征分析分布分析研究数据的分布特征和分布类型 定量数据 极差 : max - min 通过直方图直接判断分组组数 简单查看数据分布,确定分布组数 一般8-16即可 求出分组区间 pd.cut(x, bins, right) 按照组数对x分组,且返回一个和x同样长度的分组dataframe right:是否包含右边,默认为True 通过groupby查看不同组的数据频率分布 求出目标字段下频率分布的其他统计量 → 频数,频率,累计频率原创 2020-07-20 10:55:11 · 1077 阅读 · 0 评论 -
python基础笔记(五)_Bokeh基础语法
交互式图表:Bokeh绘图空间基本设置创建空间 notebook中创建 from bokeh.plotting import figure,show 导入图表绘制、图标展示模块 from bokeh.io import output_notebook 导入notebook绘图模块 output_notebook() notebook绘图命令 非notebook中创建 from bokeh.plotting import show,figure,output_fil原创 2020-07-17 19:06:39 · 1102 阅读 · 0 评论 -
python基础笔记(四)_seaborn基础语法
图表数据可视化:seaborn整体风格设置对图表整体颜色、比例等进行风格设置,包括颜色色板等 sns.set();seaborn默认设置风格 sns.set_style();风格选择包括:"white", "dark", "whitegrid", "darkgrid", "ticks" sns.despine() 设置图表坐标轴 top, right, left, bottom:布尔型,为True时不显示 默认只显示左边和下边坐标轴 sns.axes_style() 设置局部图表风原创 2020-07-17 18:11:05 · 1285 阅读 · 0 评论 -
python基础笔记(三)_Matplotlib基础语法
图表绘制工具:Matplotlib概念一个python版的matlab绘图接口 以2D为主 支持python、numpy、pandas基本数据结构 有较丰富的图表库图表窗口plt.show() : 直接生成图表 % matplotlib inline : 魔法函数(常用)==》魔法函数,不需要 plt.show() % matplotlib notebook : 弹出可交互的matplotlib窗口 % matplotlib qt5 : 弹出matplotlib控制台图表基本元.原创 2020-07-17 17:25:35 · 1299 阅读 · 1 评论 -
python基础笔记(二)_pandas的基础语法
数据分析工具包:Pandas基础序列一维数组:Series Series 是带有标签的一维数组,可以保存任何数据类型,轴标签统称为索引 .index查看series索引,类型为rangeindex .values查看series值,类型是ndarray 创建方法 由字典创建,字典的key就是index,values就是values 数组创建(一维数组),默认index是从0开始,步长为1的数字 由标量创建,如果data是标量值,则必须提供索引。该值会重复,来匹原创 2020-07-17 15:38:47 · 563 阅读 · 0 评论 -
python基础笔记(一)_numpy的基础语法
科学计算工具包:Numpy高级数值编程工具强大的N维数组对象:ndarray 对数组结构数据进行运算(不用遍历循环) 随机数、线性代数、傅里叶变换等功能基础数据结构数组的属性 ar.ndim:输出数组维度的个数(轴数),或者说‘秩’ ar.shape:输出数组的维度,对于n行m列的数组,shape为(n,m) ar.size:输出数组中元素的个数 type(ar),ar.dtype:输出数组的类型以及其中元素的类型 ar.itemsize:输出数组中每个元素的字节大小,原创 2020-07-17 14:26:20 · 451 阅读 · 0 评论 -
matplotlib绘图入门详解
matplotlib是受MATLAB的启发构建的。MATLAB是数据绘图领域广泛使用的语言和工具。MATLAB语言是面向过程的。利用函数的调用,MATLAB中可以轻松的利用一行命令来绘制直线,然后再用一系列的函数调整结果。matplotlib有一套完全仿照MATLAB的函数形式的绘图接口,在matplotlib.pyplot模块中。这套函数接口方便MATLAB用户过度到matplotlib包文章目录一、import matplotlib.pyplot as plt 二、配置参数 三、线条转载 2020-07-07 16:20:54 · 314 阅读 · 0 评论 -
groupby配合agg直接命名计算好的列名
新建一个dateFrame:df = pd.DataFrame({'A': list(chain(*[['foo', 'bar']*4])), 'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'], 'C': np.random.randn(8), 'D': np.random.randn(8)}).原创 2020-06-23 14:55:11 · 2631 阅读 · 1 评论 -
pandas的groupby重点
pandas的groupby是一个极其重要的函数,熟悉掌握能解决非常多的问题#groupby的基本语法参数DataFrame.groupby(self, by=None, axis=0, level=None, as_index: bool = True, sort: bool = True, group_keys: bool = True, squeeze: bool = False, observed: bool = False) 这是一个非常好的解释groupby的图,原理是先把数据切..原创 2020-06-23 10:52:16 · 819 阅读 · 0 评论 -
pandas的数据清洗
做数据分析之前,数据清洗总是避免不了的,耗时费劲,且无实际产出及对个人能力提升,理论上应该尽量把数据清洗时间压缩到最低。程序的角度是用更优的算法,更优的工具。运营的角度是用规范的SOP,所以记录下来清洗的基本方法是必要的。这里会涉及到非常多的内容...原创 2020-06-22 11:40:04 · 282 阅读 · 0 评论 -
matplotlib.pyplot中的rcparams参数小结:
rc参数简介pyplot中的默认配置的可以通过rcparams参数来控制,简称rc参数。rc参数存储在字典变量中,通过字典的方式进行访问。rc参数的基本格式是:plt.rcParams['font.family'] = 'YaHei Consolas Hybrid' # 设置字体样式plt.rcParams['font.size'] = '16' # 设置字体大小 = '16' # 设置字体大小plt.rcParams['figure.figsize'] = (5.0, 4.0)原创 2020-06-22 10:27:12 · 18806 阅读 · 3 评论 -
pandas中shift和diff函数关系简单总结
Signature: pandas.DataFrame.shift(self, periods=1, freq=None, axis=0) #shift方法Signature: pandas.DataFrame.diff(self, periods=1, axis=0) #diff方法先简单总结:shift可以移动df的行索引位置或是移动列值的位置 diff是对数据上下行进行计...原创 2020-04-25 11:52:23 · 1303 阅读 · 0 评论 -
玩转数据处理120题python|个人练习记录
从“早起Python” 公众号看到该文章,把内容拿下来练习一下,部分题目加了新解法。更多内容及标准答案请参考作者公众号,感谢作者的分享。文章原地址:https://mp.weixin.qq.com/s/fvEDcAqWZ-HkoTMxi995dw数据源下载:链接:https://pan.baidu.com/s/1MSqmWMiurHJSXyNBlJOEpw 密码:8mkxim...原创 2020-04-24 15:26:50 · 2010 阅读 · 0 评论 -
matplotlib的核心原理讲解
python的matplotlib包功能十分强大,能绘制各种各样的图。但是每个图创建的时候命令语句都不相同,了解各中共性有助于我们快速上手学习! figure(画布):大画布,绘图的基础。 axes(坐标系):画布的区域,你的构图。 axis(坐标轴):x轴和y轴。 fig,axes = plt.subplots(2,2,sharex=Tru...原创 2020-04-16 23:02:01 · 333 阅读 · 0 评论