python
haha_point
在学习机器学习的GISer一枚
展开
-
Python GDAL读取gdb地理数据库中的矢量数据
geodatabase地理数据库简称gdb数据库,是arcgis\qgis中常用的地理数据库,可以存储各类点线面类型的矢量数据shapefile(shp/dbf/shx)。本文介绍gdb的数据的读取,具体包含:获取要素图层的属性字段、属性字段值表、形状点坐标。语言python,版本3.7,GDAL包......原创 2022-06-27 08:00:00 · 2208 阅读 · 0 评论 -
python DataFrame的合并方法总结
#多个相同col的DataFrame合并#按照字段合并DataFramemerge函数df1=pd.DataFrame([[1,2,3],[2,3,4]],columns=['a','b','c'])df2=pd.DataFrame([[1,2,3],[2,3,4]],columns=['a','b','d'])df1 a b c0 1 2 31 2 3 4d...原创 2019-01-16 20:56:15 · 104505 阅读 · 0 评论 -
pandas的DataFrame输出成.csv文件&转化为矩阵
1. 按指定列名顺序输出DataFramepandas提供的DataFrame数据结构,读取、输出csv有专用的函数。import pandas as pddf = pd.read_csv(in_path) # 读取csv文件df=pd.DataFrame({'a':[0,1],'b':[1,2],'c':[2,3]})df.to_csv(out_path,index=False) ...原创 2018-11-30 18:50:36 · 19359 阅读 · 0 评论 -
Python2.7下载cx_Oracle包连接Oracle数据库
Python通过cx_Oracle包提供的接口连接Oracle后可以很方便地进行数据的增删改查操作,但不同版本的Oracle数据库、Python需下载版本对应的cx_Oracle才可连接成功。cx_Oracle下载新版本的cx_Oracle可通过命令pip install cx_Oracle安装成功。旧版本的cx_Oracle包需下载后手动安装,下载地址:https://sourcefo...原创 2018-11-09 22:26:01 · 5639 阅读 · 0 评论 -
【数据结构】排序算法时间效率、空间效率以及算法稳定性总结
排序算法 排序是将一组无序的记录序列调整为有序的记录序列的操作,可以方便查找。大部分的排序算法都有两个基本的操作:(1)比较两个关键字的大小.(2)将记录从一个位置移动到另一个位置。排序算法分类 根据完成整个排序过程是否需要访问外存可分为内部排序、外部排序。一般进行的是内部排序。内部排序的过程是一个逐步扩大记录的有序序列长度的过程。基于不同的扩大有序序列的方法,内部排序大致可以原创 2018-01-04 16:05:31 · 4103 阅读 · 0 评论 -
插入排序及其Python实现
插入排序是排序算法的一个大类,每步将一个带排序的对象,按其关键码大小,插入到前面已经排好序的一组对象的适当位置上,直到对象全部插入为止。 插入排序的特点是边插入边排序,子序列随时都是排好序的。 为了增进对插入排序算法的理解,本文对直接插入排序、折半插入排序、希尔排序进行了总结,并通过python语言实现算法。原创 2018-01-06 11:47:12 · 3003 阅读 · 0 评论 -
Python 递归实现决策树算法
上一篇博客记录了决策树构建的基本思想和构建的主要流程,这篇博客将利用递归的思想在Python2.7下实现决策树算法。主要利用Python中的字典数据类型,通过key,value的赋值多层嵌套字典,实现决策树的存储。并对决策树构建中遇到的右子树构建为空的问题进行了分析,通过对Python中的引用类型(列表)的硬拷贝解决了函数递归中对列表中元素改变的问题。原创 2017-12-18 21:18:39 · 2503 阅读 · 0 评论 -
赶集网租房房价爬取和Python本地服务器部署
这篇博客记录了赶集网租房房价数据爬取的爬虫,调用高德API实现房屋地理位置显示、房屋与工作地之间的出行路线查询。原创 2017-11-04 20:21:11 · 699 阅读 · 0 评论 -
Python多维数组初始化的两种方式和浅拷贝问题
Python提供了列表、元组、字典等数据结构,列表可以进行多层嵌套,形成“多维数组”。这篇博客总结了利用列表定义多维数组的两种方式。 一是列表复制定义多维数组,修改列表中的某一元素,整个列表中的对应的元素值也会随之改变(浅拷贝问题)。二是通过循环逐个初始化列表元素,可以很好地规避浅拷贝问题。原创 2017-10-23 17:00:29 · 5363 阅读 · 0 评论 -
百度地图POI数据爬取,突破百度地图API爬取数目“400条“的限制。
Python2.7使用urllib2,re包,编写爬虫,通过百度地图API获取POI的名称、经纬度数据。主要爬取方式为城市内检索、矩形检索。分享的代码能够爬取城市各POI类别的数据,通过划分格网的方式,突破百度API设置的每个类别只能获取400条POI数据的限制。原创 2017-09-24 20:56:37 · 16773 阅读 · 22 评论 -
处理Python2.7读写文件中的中文乱码问题
Python2.7对于中文编码的问题处理的并不好,这几天在爬数据的时候经常会遇到中文的编码问题。这里总结了文件读写中遇到的中文乱码问题的解决方案,供大家交流和学习。原创 2017-09-12 19:41:13 · 17190 阅读 · 3 评论 -
Python解决消除重复元素问题【2017年网易春招笔试题】
Python解决消除重复元素问题【2017年网易春招笔试题4】刷题进行时...有一个长度为n序列,移除掉里面的重复元素,但对于每种元素保留最后出现的那个。原创 2017-09-01 21:57:17 · 848 阅读 · 0 评论 -
Python爬取天气网历史天气数据
我的第一篇博客,哈哈哈,记录一下我的Python进阶之路!今天写了一个爬取天气网历史数据的小爬虫。主要使用Python的requests 和BeautifulSoup模块,核心是利用BeautifulSoup的select语句获取需要的信息。原创 2017-08-15 17:02:32 · 14978 阅读 · 13 评论 -
Python Pandas常用数据结构Series和DataFrame的相关操作
Pandas是基于Numpy构建的,包含多种高级数据结构和工具的数据分析包。Pandas中常用的数据结构有Series和DataFrame。主要介绍DataFrame的定义和数据处理中的切片操作。原创 2017-09-09 19:29:50 · 1994 阅读 · 0 评论