自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(98)
  • 收藏
  • 关注

原创 arcgis未解之谜 split函数用不了

想处理属性表中的字段,用字段计算器,发现只要用到python的字符串split方法,就会报错,原因未知。期待有朝一日能得到合理解答。

2024-01-21 13:38:44 411

原创 arcgis 做统计图时找不到属性字段/字符串字段转化为数值

一个点图层想按一个数值为百分比的字段出个图,结果到properties - symbology - quantities里面发现找不到这个字段。方法1、嫌字段计算器麻烦的话,直接在excel里把百分比形式变成正常的数值形式,再连接进gis,这样应该能识别为数值类型。原因:这个字段是在外面excel里算好,然后通过表连接过来的,在excel里就是百分数的形式,进gis以后。新建一列,字段类型按实际需求选成一种数值类型,我这里选float。新建的这列用字段计算器,语言选python,字符串里的表达式就输入。

2023-11-09 10:23:02 1538

原创 arcgis 网络分析 生成可达范围/等时线

需求:生成从地铁站步行10分钟可达的范围面图层。

2023-11-07 19:38:45 1552

原创 arcgis 面要素相交

假设有绿色面图层和紫色面图层,绿色图层有两个区域aa和bb,现在想得到紫色图层分别落在aa和bb上的部分,并附上属性值。打开属性表可以发现对应的属性值也有了。输入:把涉及到的两个图层都输入进去。输出:选好输出图层的存储路径。得到的黄色图层就是相交的部分。其他的就默认不要改就好。

2023-09-20 16:03:22 1407 1

原创 自然语言处理 中文停用词词典

我整合了4个常用的中文停用词词典(https://gitcode.net/mirrors/goto456/stopwords/-/tree/master),剔除了其中的非中文词汇,得到停用词词典如下,可直接取用。

2023-09-08 17:14:30 525

原创 Python 自然语言处理 文本分类 地铁方面留言文本

我找的4个停用词词典下载地址:https://gitcode.net/mirrors/goto456/stopwords/-/tree/master。定义文本预处理的函数,作用:去除无用字符、去除停用词、统一地铁线路名。定义函数,读取停用词词典文件,得到一个停用词列表。定义模型实际应用的函数,输入文本,输出分类结果。定义函数,生成自己的停用词词典,得到一个文件。后面我会把自己整合好的停用词词典上传。定义函数,加载用来分词的自定义词典。将关于地铁的留言文本进行自动分类。定义函数,统一地铁线路名称格式。

2023-09-08 17:06:07 371

原创 Python 统一地铁线路名称

比如,地铁1号线,可能表述为1号线、地铁1号线、轨道1号线、轨道交通1号线、1号地铁、一号线、地铁一号线、轨道一号线、轨道交通一号线、一号地铁,想统一为“地铁1号线”。最近在做一个文本挖掘项目时遇到一个很实际的问题:文本里对地铁线路名称的表述很杂乱,如何统一。前提是要先建立一个地铁线路名称词典,把上述可能的线路名表述都纳入,用来准确分词。

2023-09-08 15:17:54 160

原创 经纬度导入arcgis【自用】

工具箱 - data management tools - projections and transformations - define projection。选择1984坐标系(搜索4326)先把表格导入gis,按XY显示。然后在目录里找到坐标转换小工具。

2023-06-30 14:43:32 1393 1

原创 csv文件导入MySQL

load data infile 'C:\\ProgramData\\MySQL\\MySQL Server 8.0\\Uploads\\xxx.csv'into table tablenamefields terminated by ','optionally enclosed by '\"'lines terminated by '\n'ignore 1 lines;

2021-06-15 11:42:39 127

原创 mysql导出数据为csv文件

会了SQL以后觉得体量较大、逻辑稍复杂的数据处理在数据库里比excel里容易得多,也快速的多,但时间久了数据在MySQL里的导入导出总是容易忘记,故写在这里备忘。还是不要界面化

2021-06-15 11:10:11 558

原创 leetcode 多数元素

给定一个大小为n的数组,找到出现次数大于⌊n/2⌋的元素,称之为“多数元素”。假设数组是非空的,且多数元素存在。方法一:遍历寻找简单粗暴。去重,遍历每个元素,统计其出现的次数,如果大于⌊n/2⌋,将其返回。# 方法一:遍历def maj1(ls): for i in set(ls): if ls.count(i) > len(ls)/2: return i方法二:统计频数出现次数大于⌊n/2⌋次的多数元素,一定是数组中出现次数最

2020-08-19 08:55:53 205

原创 比较冒泡、插入、快速的运行效率

# 冒泡排序def bubble(ls): length = len(ls) while length>1: for i in range(length-1): if ls[i]>ls[i+1]: ls[i],ls[i+1] = ls[i+1],ls[i] length -= 1 return ls# 插入排序def myinsert(ls): for i in r.

2020-08-14 16:24:56 148

原创 python map()函数基本用法

今天我们来解决3个具体问题。问题1:用户输入一行数字,数字之间用空格隔开,如何接收这些数字并转换为列表。# 接收一组数字,方法1ls = []for i in input().split(): ls.append(eval(i))print(ls)其实,还有一种更优雅的方法。# 接受一组数字,方法2ls = list(map(eval, input().split()))print(ls)这里就要隆重介绍我们今天的主角——map()函数!map(function,

2020-08-13 15:24:01 3134

原创 python生成器

带有yield关键字的函数被称为生成器(generator)。生成器的适用场景如下:列表元素可以按照某种算法推算出来,用数学的话讲就是——已知数列的通项公式或递推公式。 列表元素数量庞大,可能有上百万个,甚至无穷个。 仅仅需要访问列表中前几个元素,后面绝大多数元素占用的空间都是一种浪费。先举个简单的例子。ls = [2*x for x in range(1,11)] # 列表ge = (2*x for x in range(1,11)) # 生成器print(ls)print(ge)

2020-08-12 11:16:29 215

原创 验证回文串 总结

提一个非常简单的问题:如何验证回文串。最先想到的是,把字符串反转,然后和原字符串比较。那么顺势总结一下字符串反转的方法。有的小伙伴可能会想到reverse()方法。但要注意,reverse()是列表才有的方法,用于字符串会报错。当然,把字符串转换成列表就可以:ls = list(mystr)ls.reverse()mystr1 = ''.join(ls)不过,这又是何必呢。内置函数reversed()可以用于各种序列,包括元组、列表、字符串、range等。要注意的是,它返回的是迭代器。

2020-08-02 17:51:22 257

原创 python生成《平安经》——zip()函数用法

选一个容易的来操作——各年龄平安。话不多说,直接上代码:print("初生平安,满月平安,百天平安,",end='')for i in zip([str(x) for x in range(1,101)],["岁平安"]*100): print(i[0]+i[1],end=',')print('\b。')相信大家对这段代码的含义理解起来并不难。本文着重介绍一下zip()函数。zip()函数的参数是两个或多个可迭代对象,它能将对象中对应的元素打包成一个个元组,然后返回由这些元组组成

2020-07-31 21:47:30 374

原创 python 字符串保留特定字符 全面总结

leetcode上有一道很简单的题目:给定一个字符串,验证它是否是回文串,只考虑字母和数字字符,忽略字母的大小写。将题目拆解成两部分:第一,处理字符串,使其只保留字母和数字,且字母统一大小写;第二,验证回文串。本文先来讲讲第一部分。改变字母大小写很简单,用内置函数即可。重点在于只保留字母和数字字符。我首先想到的是正则。对于正则,我并不是很会。难者不会,会者不难,我觉得它太难了,完全不适合我这种又懒又笨的猪脑子,向来是现用现查。这一查,就查出两种方法。算上不用正则的,总计3种方

2020-07-26 00:08:50 5275

原创 Python 字符串只保留某一种字符

正则是个好东西。re里面的功能太多太杂,为了简单方便,统一只记一个函数:findall()import remystr = "hahaAAA哈哈123./!#"str1 = ''.join(re.findall('[\u4e00-\u9fa5]',mystr)) # 只保留汉字print(str1)str2 = ''.join(re.findall('[a-z]',mystr)) # 只保留小写字母print(str2)str3 = ''.join(re.findall('[0

2020-07-15 11:18:07 2497

原创 python 随便玩玩系列2:逻辑运算符

时隔半年重温python基础教程,发现了以前没注意过的事情。a and b,and是逻辑运算符与,如果a和b都为True,结果返回True,否则返回False。问题来了,如何自己写代码实现“与”?即实现判断a and b是true还是false,要求不能使用编程语言自带的逻辑运算符(何苦自己为难自己……)我首先想到的:如果a是false,那么大局已定,直接返回false;如果a不是false,那么认为a是true,接着看b;(只能说认为a是true,其实python里true的值为1)

2020-07-03 15:10:35 275

原创 cajviewer 卡顿

之前用cajviewer 7.2读论文卡的一笔,看网上说7.1版本的会好很多,不过今年看到7.3版本推出了,于是我没有尝试7.1的旧版,直接安装了7.3的新版。但实际使用之后我大失所望,7.3还是原来那个尿性,并没有多大改善,那种滑动鼠标滚轮时页面刷新速度跟不上的感觉,就好比看视频卡、听结巴说话一样令人烦心。之后我抱着试试看的心态下载了caj云阅读,没想到效果出奇的好,浏览论文十分顺畅,从此跟viewer说拜拜,开始一心一意使用云阅读。顺带一提,理论上viewer和云阅读都有把caj打印成PDF

2020-05-09 11:30:20 5215

原创 ArcGIS 空间连接

需求:站点(点图层)地块(面图层)若地块在站点800米范围内(地块与站点800米圆形缓冲区有相交部分),就给该地块的新属性赋值附近站点ID;若地块同时与多个站点邻近,则有几个站点该地块就重复几个,重复的要素只有附近站点ID这一个属性不同。先给每个站点生成800米圆形缓冲区。一对一连接windows - search - spatial jointarget fe...

2020-05-08 11:10:17 7699 1

原创 ArcGIS 要素转面 消除重叠

如图,面图层要素之间出现重叠,会给计算面积带来困扰。为了消除重叠,可以采用要素转面工具,而后再用空间连接来补充属性值。要素转面Arctoolbox - data management tools - features - feature to polygonInput Features:把有重叠的图层(图层1)输入进来Output Feature Class:设定新图层(图...

2020-04-28 20:08:47 13949 2

原创 ArcGIS Data Driven Pages 实现要素视图切换

视图可以在同一图层的各个要素间快速切换,对于批量出图也有用。customize - toolbars - data driven pages出现的小框里,点最左边的按钮(setup)勾选Enable data driven pagesLayer:选择要浏览的图层Name Field:选择翻页的时候显示的字段Sort Field:选择用来确定排列顺序的字段OK这样一来...

2020-04-28 19:24:46 671

原创 ArcGIS summary statistics 实现group by

发现arcgis里面一个强大的功能:summary statistics,能够实现

2020-04-28 16:53:48 2168

原创 ArcGIS 绘制热力图

现有一个面图层,是一个个区块;还有一个点图层,每个点有一定的属性(可能还有权重之类的);想根据每个区块点的密度做一个“热力图”。大致思路:使用空间连接做聚合计算,得到一个有聚合计算结果的新的面图层 通过坐标由面图层再弄出一个点图层,每个区块对应一个点 用插值工具做“热力图”用空间连接做聚合计算打开点图层的属性表,把不需要的字段删掉,怕误删的话可保存副本。这步最好要做,...

2020-04-24 16:37:21 8652

原创 ArcGIS 变换坐标系

想计算周长或者面积,却发现坐标系不对。看来,要计算周长,必须使用投影坐标系。只要把工作空间的坐标系换成投影坐标系就好了。更改数据框的坐标系菜单栏 View -数据框属性 - 坐标系 - 投影坐标系 - Gauss Kruger - CGCS2000 - CGCS2000 3 Degree GK CM 120E我选这个120E是因为我研究的是杭州地区。不用点转换,直接确定就...

2020-04-22 15:54:40 2035

转载 ArcGIS 把字段允许空值设为否

想把字段是否允许空值这个属性改成否,却怎么都实现不了。解决思路:重新创建新的要素类,取代原来的。步骤:在 目录 窗格中,右键单击相应的地理数据库(gdb文件)> 新建 > 要素类。在新建要素类对话框中,为新要素类设置名称,并选择正确的类型和坐标系。这步最好是先核实好原来的要素类的坐标系是什么,然后选一样的。单击 下一步 按钮直到显示字段名称和数据类型表,然后单击...

2020-04-22 14:48:39 7598

原创 ArcGIS 字段值替换

gis小白开始摸着石头过河了。比如:把某个字段xx中所有的null替换为0打开属性表点击上面菜单栏里第3个小图标:按属性选择把筛选条件输进去:xx IS NULL点击下方的只显示被选中记录右击字段名 – 字段计算器把要替换的值输进去 – 确定...

2020-04-22 10:35:34 10792 5

原创 绘制词云图

当个技术宅其实挺难的,我代码能力太弱了。需要放在工作路径下的文件有:中文字体文件、背景图片、停用词、语料。导入需要的库:import csvimport re, jieba# 词云生成工具from wordcloud import WordCloud,ImageColorGenerator# 对中文进行处理import matplotlib.font_manager as ...

2019-12-10 15:16:55 419

原创 Word无法打开该文件,因为文件格式与扩展名不匹配

昨晚编辑保存好的word文件,今早打开时却发现这个问题:Word无法打开该文件,因为文件格式与扩展名不匹配按照网上的说法,把docx强行改成doc。暂时不知win10下这个后缀名怎么改,win7下修改很简单。但此时,打开它出现另一个错误信息:word无法从该位置打开扩展名为.asd的文件,请将此文件移动到原始.asd位置,然后重试最后把这个doc文件复制到C:\Use...

2019-12-05 10:42:45 14962 6

原创 AttributeError: module 'tensorflow' has no attribute 'get_default_graph'

在Python3.7版本下,用conda方法安装Keras,默认后端是TensorFlow。# 查看Python版本import sysprint(sys.version)Keras包可以导入成功,但运行一句简简单单的代码却报错。model = keras.Sequential()报错信息:AttributeError: module 'tensorflow' has no...

2019-11-09 12:18:37 1841

转载 leetcode 买卖股票的最佳时机

给定一个数组,它的第i 个元素是一支给定股票第 i 天的价格。如果你最多只允许完成一笔交易(即买入和卖出一支股票),设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例 1:输入: [7,1,5,3,6,4]输出: 5解释: 在第 2 天(股票价格 = 1)的时候买入,在第 5 天(股票价格 = 6)的时候卖出,最大利润 = 6-1 = 5 。 ...

2019-09-27 14:38:20 93

原创 leetcode 爬楼梯

假设你正在爬楼梯。需要 n阶你才能到达楼顶。每次你可以爬 1 或 2 个台阶。你有多少种不同的方法可以爬到楼顶呢?注意:给定 n 是一个正整数。示例 1:输入: 2输出: 2解释: 有两种方法可以爬到楼顶。1. 1 阶 + 1 阶2. 2 阶示例 2:输入: 3输出: 3解释: 有三种方法可以爬到楼顶。1. 1 阶 + 1 阶 + 1 阶2. 1 阶...

2019-09-23 10:10:01 110

原创 leetcode x的平方根

实现int sqrt(int x)函数。计算并返回x的平方根,其中x 是非负整数。由于返回类型是整数,结果只保留整数的部分,小数部分将被舍去。示例 1:输入: 4输出: 2示例 2:输入: 8输出: 2说明: 8 的平方根是 2.82842..., 由于返回类型是整数,小数部分将被舍去链接:https://leetcode-cn.com/problems/...

2019-09-22 20:25:07 159

原创 leetcode 加一

给定一个由整数组成的非空数组所表示的非负整数,在该数的基础上加一。最高位数字存放在数组的首位, 数组中每个元素只存储单个数字。可以假设除了整数 0 之外,这个整数不会以零开头。示例:输入: [1,2,3]输出: [1,2,4]解释: 输入数组表示数字 123链接:https://leetcode-cn.com/problems/plus-oneclass Soluti...

2019-09-12 15:31:05 93

原创 leetcode 最大子序和

给定一个整数数组 nums,找到一个具有最大和的连续子数组(子数组最少包含一个元素),返回其最大和。示例:输入: [-2,1,-3,4,-1,2,1,-5,4],输出: 6解释:连续子数组[4,-1,2,1] 的和最大,为6链接:https://leetcode-cn.com/problems/maximum-subarray动态规划没学过。就我这个智商,基本上就告别...

2019-09-06 11:13:15 99

原创 python 列表统计元素频数、频率

一个很简单的问题:统计列表中元素出现个数、比例。想了以下4种解决方案。我感觉pandas应该是最快的,不过在不能调用第三方库的情况下,可以试试前面几种哪个快些。list.count()ls = ['a','a','a','b','b','c']countDict = dict()proportitionDict = dict()for i in set(ls): c...

2019-09-05 15:07:37 26042

转载 Mysql 分数排名

编写一个 SQL 查询来实现分数排名。如果两个分数相同,则两个分数排名(Rank)相同。请注意,平分后的下一个名次应该是下一个连续的整数值。换句话说,名次之间不应该有“间隔”。+----+-------+| Id | Score |+----+-------+| 1 | 3.50 || 2 | 3.65 || 3 | 4.00 || 4 | 3.85 || 5 ...

2019-09-04 14:31:58 258

原创 leetcode 报数

报数序列是一个整数序列,按照其中的整数的顺序进行报数,得到下一个数。其前五项如下:1. 12. 113. 214. 12115. 1112211被读作"one 1"("一个一") , 即11。11 被读作"two 1s"("两个一"), 即21。21 被读作"one 2", "one 1"("一个二","一个一...

2019-09-04 11:16:16 98

原创 Mysql 第N高的薪水

编写一个 SQL 查询,获取 Employee 表中第n高的薪水(Salary)。+----+--------+| Id | Salary |+----+--------+| 1 | 100 || 2 | 200 || 3 | 300 |+----+--------+例如上述Employee表,n = 2时,应返回第二高的薪水200。如果不存在...

2019-09-03 11:51:22 289

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除