![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
业务总结
Alexandra0119
这个作者很懒,什么都没留下…
展开
-
20220601超简单百度地图街景图片爬取+绿视率计算
真的不难咯。原创 2022-06-01 22:58:36 · 10391 阅读 · 22 评论 -
【长期更新】咨询分析中的n个真实数据处理场景
在咨询分析中,数据分析是重要的工具。但咨询中数据分析的特点是数据获取较为复杂,反而,数据处理较为简单和机械。人们有时会倾向于在excel里完成任务,但是这可能会导致效率低下;反之,过分信赖python也并非是效率利器,因为有些基础的分析完全可以在excel中完成并保存。本文是对打工中基础数据处理和分析的记录和总结,不涉及爬虫、机器学习等内容。场景1:根据末尾字符分类+遍历筛选+汇总场景描述:需要对河南省2000-2019年县、县级市和市辖区的人均GDP做统计和比较。如果用exc.原创 2021-12-28 11:07:04 · 687 阅读 · 2 评论 -
20211226业务总结--python实现坐标转换和正逆地理编码
本文参考了github开源爬虫项目map-easygo,GitHub - liujiao111/map-easygo: 使用python爬取微信宜出行人流量数据首先是导入相关的库和计算要用到的参数:import requestsimport timeimport mathx_pi = 3.14159265358979324 * 3000.0 / 180.0pi = 3.1415926535897932384626 # πa = 6378245.0 # 长半轴ee = 0.0066原创 2021-12-26 18:09:13 · 808 阅读 · 0 评论 -
20211110业务总结-快速将pdf中的表格提取成excel
import pdfplumberimport pandas as pdwith pdfplumber.open(r'H:\学位论文相关\数据\中国开发区(2018).pdf') as pdf: for i in range(0,53): page = pdf.pages[i] for row in page.extract_tables(): print(row) list = pd.DataFrame(dat.原创 2021-11-10 17:36:23 · 719 阅读 · 0 评论 -
20210511业务总结 利用folium调用多风格底图
做分析图的时候经常需要用到不同风格的底图,但是当前这方面工具在国内国外、地图样式上总是不尽如人意。下面是我找到最快捷好用的解决方案:首先推荐一个底图合集:http://openwhatevermap.xyzimport folium''1、设置经纬度高德坐标拾取器(中国) https://lbs.amap.com/console/show/picker谷歌地图邮件坐标(外国)https://www.google.com/maps伦敦:51.51061318975203, -0.12.原创 2021-05-11 23:13:53 · 520 阅读 · 0 评论 -
20210322业务总结:批量出gis图
通常在有了excel表格之后导入gis一张张出图很麻烦,用pyecharts可以将这一过程快速简化。示例的可视化单元是河南省市级单元,注意这里在存储文件的时候用正则表达式实现简单的自动命名。如果不加range_color就是默认的色带颜色,如果想要自定义,可以独立修改,也可以专门设计一个字典colors存储不同的色带颜色,然后通过自动colors[i]自动替换颜色。from pyecharts.charts import Mapfrom pyecharts import options as o原创 2021-03-22 16:48:03 · 197 阅读 · 0 评论 -
20210222业务总结:熵值法+AHP层次分析打分代码
在业务中经常遇到需要对多个对象进行打分的任务,如何针对不同属性赋予权重是关键一步。为了既满足数据客观性又满足主管需求,一般通过熵值法结合AHP层次分析法(即专家打分法)赋予权重并进行评分。主要方法是先根据熵值法计算一轮,需要给定正负向指标以及对象列。在此基础上,允许对各层权重、独立权重进行调整,以符合实际需求。主要由函数cal_Weight实现。代码如下:import pandas as pdclass EmtropyMethod: def __init__(self, ind原创 2021-02-22 21:11:48 · 3382 阅读 · 3 评论 -
2021-02-19 DCIC大赛结果提交
感谢阿水大佬分享的baseline!原创 2021-02-19 12:49:26 · 169 阅读 · 0 评论 -
20210202业务总结:K-means和分层聚类
由于论文需求,在前人基础上做了K-means和分层聚类,并且搭建了一下pandas处理数据的工作流。这篇文章记录一下两段聚类的代码,很多细节理解得还不够深入,我会后面碰到了再钻研并补充。K-means:对13个特征,105个对象做分类。输出结果到新增的列,没有可视化。保持csv文件的标题栏是英文,这样比较不容易出现编码错误。from copy import deepcopyimport numpy as npimport pandas as pdfrom matplotlib import原创 2021-02-02 21:51:33 · 204 阅读 · 0 评论