自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 代码随想录第六天|242.有效的字母异位词,349.两个数组的交集,202.快乐数,1.两数之和

哈希表是根据关键码的值而直接进行访问的数据结构。如果两个内容都映射到了同一个索引下标,就是哈希碰撞。一般哈希碰撞有两种解决方法, 拉链法和线性探测法。拉链法就是直接外挂在上面,线性探测法是依靠哈希表中的空位来解决碰撞问题。常见的三种哈希结构是数组、set(集合)和map(映射)。std::unordered_map 底层实现为哈希表,std::map 和std::multimap 的底层实现是红黑树。

2024-03-07 10:37:49 812

原创 代码随想录算法训练营第四天 |24. 两两交换链表中的节点 ,19.删除链表的倒数第N个节点 ,面试题 02.07. 链表相交 ,142.环形链表II

我基础比较差,时间又紧张,努力过后发现群里的打卡进度还是跟不上了。。没关系,我按自己的节奏先刷完第一遍!!!

2024-02-11 12:18:38 352

原创 代码随想录算法训练营第三天 | 203.移除链表元素 ,707.设计链表,206.反转链表

写的时候发现自己还是眼高手低了,从第一个函数就卡住了,返回来看了一眼答案,发现leetcode的官网上给的模板没有定义节点就直接定义链表了,跳过了一步,导致链表的size没有定义过。插入节点需要定义一个新的链表节点,即让newnode的next指向head,然后dummyhead的next指向newnode,这里不能颠倒,因为颠倒后第二步就无法操作了(这里画个图就很清楚,因为dummyhead到head的指针消失了,就找不到head了)。后面又试了一下递归法。当时听的时候就不太懂,直接看答案,然后复现了。

2024-02-05 16:57:03 832 1

原创 代码随想录算法训练营第二天 | 977.有序数组的平方,209.长度最小的子数组,59.螺旋矩阵II

加班到晚上十点钟回来实在刷不动题了,第二天早上起来摸鱼刷题,否则要追不上了!

2024-01-26 16:08:28 342 1

原创 代码随想录算法训练营第一天| 704. 二分查找、27. 移除元素

建筑行业工作党终于下定决心转算法了!忍不了了。。感觉自己基础不扎实,项目做了不少,但题基本上没刷过,希望能在代码随想录里面把自己的基础打牢一点,offer早早来!

2024-01-24 23:56:48 839 1

原创 20220601超简单百度地图街景图片爬取+绿视率计算

真的不难咯。

2022-06-01 22:58:36 10162 22

原创 【长期更新】咨询分析中的n个真实数据处理场景

在咨询分析中,数据分析是重要的工具。但咨询中数据分析的特点是数据获取较为复杂,反而,数据处理较为简单和机械。人们有时会倾向于在excel里完成任务,但是这可能会导致效率低下;反之,过分信赖python也并非是效率利器,因为有些基础的分析完全可以在excel中完成并保存。本文是对打工中基础数据处理和分析的记录和总结,不涉及爬虫、机器学习等内容。场景1:根据末尾字符分类+遍历筛选+汇总场景描述:需要对河南省2000-2019年县、县级市和市辖区的人均GDP做统计和比较。如果用exc.

2021-12-28 11:07:04 683 2

原创 20211226业务总结--python实现坐标转换和正逆地理编码

本文参考了github开源爬虫项目map-easygo,GitHub - liujiao111/map-easygo: 使用python爬取微信宜出行人流量数据首先是导入相关的库和计算要用到的参数:import requestsimport timeimport mathx_pi = 3.14159265358979324 * 3000.0 / 180.0pi = 3.1415926535897932384626 # πa = 6378245.0 # 长半轴ee = 0.0066

2021-12-26 18:09:13 807

原创 20211207原创教程-神经网络模型调参

1、模型验证一般很少在神经网络里用交叉验证,只需要划分训练集和验证集即可。在下面的参数中可以设置验证集比例(validation_split):model = get_new_model(input_shape)model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])model.fit(X_train_titanic, y_train_titanic, validation_sp

2021-12-06 21:55:03 533

原创 20211206原创教程-用一篇文章光速上手神经网络

用神经网络来解决回归和分类问题,通常被称为深度学习。神经网络是一个非常好用的工具,使用这个工具,相当于训练自己的AI(人工智能)。相比于机器学习,神经网络可以省略做特征工程的过程,解决各列特征并非独立同分布的问题。同时,神经网络能够处理的问题类型更广(CV,NLP,推荐算法等)。本文的内容是BP神经网络的理解+对应Keras实现框架的解读。目录一、神经网络的理解①神经网络的结构②神经网络的运行③神经网络的调参④神经网络的解释性二、Keras框架实现①Keras建模四步

2021-12-06 20:57:35 349

原创 20211110业务总结-快速将pdf中的表格提取成excel

import pdfplumberimport pandas as pdwith pdfplumber.open(r'H:\学位论文相关\数据\中国开发区(2018).pdf') as pdf: for i in range(0,53): page = pdf.pages[i] for row in page.extract_tables(): print(row) list = pd.DataFrame(dat.

2021-11-10 17:36:23 715

原创 20210531踩坑记录:geopandas安装和geojson可视化

geopandas的安装是最最最麻烦的了,有很多依赖库,然后版本还很难协调……我的环境是python3.7,最终成功的效果大概经历了这些步骤:conda install -c conda-forge geopandas 这个是官网的安装方法之一,会把附带的依赖库一起安装上,如果用pip还需要提前安装GDAL、pyproj这些,而且版本很难协调。然而仍然因为pyproj报错。这个时候如果用conda install pyproj会安装成1.9.5.1版本,但事实上需要3.0.1版本才满足需求

2021-05-31 23:16:01 1289

原创 20210511业务总结 利用folium调用多风格底图

做分析图的时候经常需要用到不同风格的底图,但是当前这方面工具在国内国外、地图样式上总是不尽如人意。下面是我找到最快捷好用的解决方案:首先推荐一个底图合集:http://openwhatevermap.xyzimport folium''1、设置经纬度高德坐标拾取器(中国) https://lbs.amap.com/console/show/picker谷歌地图邮件坐标(外国)https://www.google.com/maps伦敦:51.51061318975203, -0.12.

2021-05-11 23:13:53 513

原创 20210322业务总结:批量出gis图

通常在有了excel表格之后导入gis一张张出图很麻烦,用pyecharts可以将这一过程快速简化。示例的可视化单元是河南省市级单元,注意这里在存储文件的时候用正则表达式实现简单的自动命名。如果不加range_color就是默认的色带颜色,如果想要自定义,可以独立修改,也可以专门设计一个字典colors存储不同的色带颜色,然后通过自动colors[i]自动替换颜色。from pyecharts.charts import Mapfrom pyecharts import options as o

2021-03-22 16:48:03 194

原创 20210222业务总结:熵值法+AHP层次分析打分代码

在业务中经常遇到需要对多个对象进行打分的任务,如何针对不同属性赋予权重是关键一步。为了既满足数据客观性又满足主管需求,一般通过熵值法结合AHP层次分析法(即专家打分法)赋予权重并进行评分。主要方法是先根据熵值法计算一轮,需要给定正负向指标以及对象列。在此基础上,允许对各层权重、独立权重进行调整,以符合实际需求。主要由函数cal_Weight实现。代码如下:import pandas as pdclass EmtropyMethod: def __init__(self, ind

2021-02-22 21:11:48 3364 3

原创 2021-02-19 DCIC大赛结果提交

感谢阿水大佬分享的baseline!

2021-02-19 12:49:26 169

原创 20210205源码解读-Bokeh的箱线图(boxplot)绘制

源码链接:http://docs.bokeh.org/en/latest/docs/gallery/boxplot.html?highlight=boxplot效果:首先需要回顾一下箱线图的基本知识。箱形图(英文:Box plot),又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因型状如箱子而得名。此图中之盒子之外,也常会有线条在上下四分位数之外延伸出去,像是胡须,因此也称为盒须图。离群值会有时会画成是个别的点。(维基百科)(图示:来自highchart,

2021-02-05 16:19:10 853

原创 20210203力扣刷题-回文数

题目:给你一个整数 x ,如果 x 是一个回文整数,返回 ture ;否则,返回 false 。回文数是指正序(从左向右)和倒序(从右向左)读都是一样的整数。例如,121 是回文,而 123 不是。几乎是遇到最简单的题了,暴力解法很快写出来了class Solution: def isPalindrome(self, x: int) -> bool: str_len = len(str(x)) new_str = "" ...

2021-02-03 22:35:45 120

原创 20210202业务总结:K-means和分层聚类

由于论文需求,在前人基础上做了K-means和分层聚类,并且搭建了一下pandas处理数据的工作流。这篇文章记录一下两段聚类的代码,很多细节理解得还不够深入,我会后面碰到了再钻研并补充。K-means:对13个特征,105个对象做分类。输出结果到新增的列,没有可视化。保持csv文件的标题栏是英文,这样比较不容易出现编码错误。from copy import deepcopyimport numpy as npimport pandas as pdfrom matplotlib import

2021-02-02 21:51:33 198

原创 20201229力扣刷题-罗马数字转整数

罗马数字包含以下七种字符:I,V,X,L,C,D和M。字符 数值I 1V 5X 10L 50C 100D 500M 1000例如, 罗马数字 2 写做II,即为两个并列的 1。12 写做XII,即为X+II。 27 写做XXVII, 即为XX+V+II。...

2020-12-30 00:45:38 127

原创 力扣刷题20201227-整数反转

题目:给出一个 32 位的有符号整数,你需要将这个整数中每位上的数字进行反转。示例1:输入: 123输出: 321示例 2:输入: -123输出: -321示例 3:输入: 120输出: 21注意:假设我们的环境只能存储得下 32 位的有符号整数,则其数值范围为[−2^31,2^31− 1]。请根据这个假设,如果反转后整数溢出那么就返回 0。审题:1、32位的理解:32位即32位二进制整数,即内存中有32个单位空间存这个数据。有符号说...

2020-12-28 00:06:25 105

原创 力扣刷题20201226-两数之和

题目:给定一个整数数组 nums和一个目标值 target,请你在该数组中找出和为目标值的那两个整数,并返回他们的数组下标。你可以假设每种输入只会对应一个答案。但是,数组中同一个元素不能使用两遍。审题:1、对应target的有且仅有两个整数。2、数组中同一个元素不能使用两遍意思是遍历不能重复,并非数组内不能有重复元素。我的答案:class Solution: def twoSum(self, nums: List[int], target: int) -> List...

2020-12-26 22:27:23 153 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除