自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 收藏
  • 关注

原创 城市系统应用其一-表征城市交通模式

墨西哥城的案例研究摘要:无缝访问有价值的目的地,如工作场所、学校、公园或医院,影响着全世界人民的生活质量。第一个规划和改善服务邻近度的步骤是估计出行次数由城市的不同部分组成。具有代表性的数据是一个挑战可用于该目的。依靠昂贵且不经常收集的旅行对设施旅行分布建模的调查减缓了决策制作过程。已经收集的越来越多的数据,如果用正确的方法,可以帮助我们规划和了解城市。在这一章当中,我们检查从被动收集的数据中提取的人类流动模式。我们显示在 Google 地方信息上注册的兴趣点 (POI) 的使用结果近似于一个城市的旅游

2022-03-16 10:58:09 1257 2

原创 城市系统应用介绍

摘要 随着新的信息技术和来自广泛领域的大量数据政府机构和公众、城市研究人员已经开始研究如何使用这些数据来增强各种城市系统的规划和管理。因此,新的方法收集和分析有关城市系统的复杂时空数据旨在解决各种城市问题。这些城市系统包括交通系统、能源系统和卫生系统。近年来,相当多的新已开展工作以研究新的信息技术和数据如何可以增强我们对城市问题的理解和解决问题的能力。八个本节中的章节介绍了城市信息学在特定领域的各种应用。城市系统或现象,包括人类流动和旅行、城市货运系统、城市复原力和灾害响应、城市犯罪、城市治理、将遥感用

2022-03-15 17:08:59 3673

原创 城市信息学其六-信息时代的城市概念化

抽象城市是人类最重要和最复杂的创造物之一,自数字技术出现以来,它们的复杂性一直在稳步增加年龄。信息学,即信息科学,现在已经发展到了一个地步对提高理解和基于证据的可操作知识的高度期望城市研究人员、管理者和规划者的优势似乎是合理的。但是在那里的时候比以往任何时候都更多的信息,多种理论,模型,方法,迄今为止,我们所依赖的工具可能在城市中不再有用。信息时代。本章概述了城市的事态科学和规划,指出以前可靠方法的局限性和面对城市生活和功能的巨大发展的工具发达国家。本章最后提出了面向数据的策略的建议这可能会...

2022-03-14 15:02:39 1098

原创 城市信息学其五-空间经济学、城市信息学、和交通便利

在本章中,我们将展示一种新的空间经济量化方法可以使用一系列回归模型来开发运输效应的城际交通改善评估。计量经济模型不只检查了它们各自的功能形式和估计诊断,但也通过将结果系数值与先前的理论值进行比较期望。通过这种方法,我们的目标是更准确地识别运输对实体经济的影响,同时不会大幅增加分析工作用于实际研究,例如贷款项目评估。我们报告了广东省的计量经济分析,这三个省之一中国主要的特大城市地区和新技术的主要采用者。这分析包括适合区域经济的香港和澳门活动。虽然我们首先开始研究这个量化是因为 World银行贷款项目,我们

2022-03-14 11:31:16 1736

原创 城市信息学其四—城市新陈代谢

摘要:城市新陈代谢(UM)基本上是一个会计框架,其目标是量化城市中资源(如材料和能源)的流入、流出和积累。本章的主要目的是介绍UM。首先,简要介绍了UM的历史。然后介绍了执行UM的三种不同方法:第一种方法采用自底向上的方法,通过收集/估计单个流;第二种方法采用自上而下的方法,使用全国范围的输入输出数据;第三种方法采用混合方法。随后,为了说明应用UM的过程,我们提供了一个实际案例研究,使用新加坡的特殊状态作为下一个模板。最后,讨论了UM当前和未来的机遇和挑战。总的来说,到21世纪初,UM的开发和应用相对缓

2022-03-04 17:18:40 1999

原创 城市信息学其三-智能地理可实现个性化和可持续的未来城市交通

摘要:几十年来,城市流动性和人的交通量一直在不可阻挡地增加。尽管流动性给我们的社会带来了优势和机遇,但也存在严重的缺陷,例如交通部门是温室气体排放和交通堵塞的主要贡献者之一。未来,越来越多的人将生活在大城市环境中,因此,必须解决这些问题,以确保宜居环境。信息和通信以及地理信息技术的快速发展为城市信息和智能城市铺平了道路,这些城市允许进行大规模的城市分析,并支持人们进行复杂的移动决策。本章展示了geosmartness是一种新型空间数据源、计算方法和地理空间技术的组合,它如何为科学家提供机会,对移动模式进

2022-02-27 22:51:27 1797

原创 城市信息学其二-城市人类动力学

摘要:城市地区是人们集中在相对高密度建筑环境中进行广泛活动的地方。每个城市地区都应提供足够的基础设施和服务,以满足其人口的需求。由于各种资源、服务和设施位于不同的位置,城市地区呈现出一个复杂的人流、物流和信息流系统,以支持人类社会的经济、社会、文化和政治系统。这些活动、流程和系统由各种过程驱动,并表现出各种时空模式,这些模式是人类动力学的结果。然而,如何研究城市地区的各种动态过程和复杂系统一直是一个具有挑战性的研究课题。城市人类动态跨越多个维度,可以从不同的视角进行研究。本章讨论了城市动力学和人类动力学

2022-02-21 13:09:24 773 1

原创 城市信息学-街景成像用于城市基础设施和服务的自动评估

摘要:城市中许多形式的环境数据可以跟踪城市的短期运行,如交通管理、垃圾收集、检查或非紧急维护请求。然而,可以说,城市分析的最大作用是建立可测量的目标,并跟踪系统发展目标的进展,这些目标与人类发展和长期可持续性相联系。这种方法面临的挑战是新技术能力(如传感、机器学习和地方知识)与居民和市政府的运作之间的联系。在这里,我们描述了一个新兴项目,通过这些方法的融合,对加拉帕戈斯群岛快速发展的城镇的可持续发展进行长期监测。我们展示了当此类行动与城市环境的地图绘制和深入学习特征相结合时,协作地图绘制和360度街景捕捉如

2022-02-04 18:27:08 827

原创 智慧城市读物-城市信息学-城市信息学的定义

目录预览:第一部分:城市科学的维度第二部分:城市系统和应用第三部分:城市遥感第四部分:城市大数据基础设施第五部分:城市计算第六部分:未来展望城市信息学的定义:城市信息学是一种跨学科的方法,以新信息技术为基础,以计算机和通信的当代发展为基础,使用系统理论和方法来理解、管理和设计城市。它整合了城市科学、地理信息学和信息学:城市科学提供了对城市地区活动、地点和流量的研究;geomatics提供了在现实世界中测量时空和动态城市对象以及管理从测量中获得的数据的科学和技术;信息学提供信息处理

2021-12-23 22:57:05 966

原创 2021年年末Rhain职业规划

此文主要叙述大数据行业从业者的技术学习规划主要分为两部分,开发和分析开发开发常见项目:电商,物流和推荐系统学习顺序:离线电商项目覆盖需求分析、数仓体系构建、技术选型、集群规划、数据治理,经典问题思考定位与解析,生产级调优全流程, 还原完备的PB级企业级数仓系统构建。智慧物流项目完成多源物流数据采集、聚合、离线分析/实时预警,并实现基于大数据+机器学习算法+数据挖掘的仓储销量预测、货物配送动态规划等。(暂无资料)实时电商项目着重于实时的数据分析处理,数仓项目的需求分析、架构设计、环

2021-12-22 20:23:17 1230

原创 特征工程-什么是特征工程(Kaggle微课)

你将会学到:确定交互信息中哪些功能最重要在多个现实问题领域中发现新特征使用目标编码对高基数类别进行编码使用k-means聚类创建分割特征利用主成分分析将数据集的变化分解为特征特征工程的目标:提高模型的预测表现,减少对算力和数据的需求,提高结果的解释性要使功能有用,它必须与模型能够学习的目标有关系。例如,线性模型只能学习线性关系。因此,当使用线性模型时,您的目标是变换特征,使其与目标线性关系。这里的关键思想是,应用于特征的转换实质上成为模型本身的一部分。假设你试图从一边的长

2021-12-13 15:32:15 1034

原创 Python自动对excel剪贴板内容去重

需求:现有字符串"小明|小红|小刚|小明"想对这样的字符串进行去重结果为"小明|小红|小刚"整体代码架构:1、定义去重函数(功能模块)2、访问剪贴板并将内容返回剪贴板(流程模块)3、轮询(增值模块)一、定义功能模块功能原型长这样message1 = "一|二|三|一"#传入字符串message2 = message1.split("|")#将message1按照|分割为列表message3 = list(set(message2))#列表去重message3.so

2021-11-05 10:50:47 178 1

原创 java数组算法练习题

1、使用冒泡排序,实现如下的数组从小到大排序int[] arr = nem int[]{34,5,22,0,-3};for(int i = 0 < arr.length -1;i++){ for(int j =0; j<arr.length -1-i; if{arr(j) > arr[j+1]){ int temp = arr[j]; arr[j] = arr[j+i]; arr[

2021-10-18 10:40:23 239 1

原创 保安也有梦第二期java数组

1、写出一维数组初始化的两种方式int[] arr = new int[5];//动态初始化String[] arr1 = new String[]{"Tom","Jerry","Jim"};//静态初始化数组一旦初始化,其长度就是确定的。arr.length数组长度一旦确定,就不可修改。2、写出二维数组初始化的两种方式int[][] arr = new int[4][3];//动态初始化1int[][] arr1 = new int[4][];//动态初始化23、如何

2021-10-14 22:43:25 70

原创 保安也有梦之Java学习

目录概述常见DOS指令:计算机语言介绍JVM和垃圾回收JDK、JRE、JVM的关系配置环境变量第一个JAVA程序HelloWorld概述Java语言三层面:1、基本语法:变量、运算符、流程控制、数组2、面向对象:类、对象、三大特征、接口、设计模式3、高级应用:多线程、集合、IO流、网络编程、反射、NIO编码习惯与高内聚低耦合JAVA基础是学习JavaEE、大数据、安卓开发的基石。算法加数据结构等于程序常见DOS指令:dir列出当前目录文件

2021-10-12 02:07:11 108

翻译 电影推荐系统kaggle

一、推荐系统的时代数据收集的快速增长带来了一个新的信息时代。数据正被用于创建更高效的系统,而这正是推荐系统发挥作用的地方。推荐系统是一种信息过滤系统,因为它们可以提高搜索结果的质量,并提供与搜索项目更相关或与用户的搜索历史更相关的项目。它们用于预测用户对某个项目的评分或偏好。几乎每一家大型科技公司都以某种形式应用了它们:亚马逊用它来向客户推荐产品,YouTube用它来决定下一步在autoplay上播放哪个视频,Facebook用它来推荐喜欢的页面和关注的人。此外,像Netflix和Spotify..

2021-10-08 17:43:33 2347

原创 Linux基础入门-腾讯云实验室

腾讯云大学,虽然也很好,但是缺少了Kaggle的引导学习过程。目录操作创建目录切换目录移动目录删除目录查看目录下的文件文件操作创建文件复制文件删除文件查看文件内容过滤管道与重定向运维常用命令ping命令netstat命令ps命令目录操作...

2021-10-07 10:24:39 93

原创 保安日记JAVA最基础

由于笔者的目标是全栈,所以今天就来沾一沾这传说中的JAVA,如果以后有机会,定是要自己开发自己的AAAS(分析即服务)公司的。昨晚有幸看到了一位资深程序员----一只程序汪的一系列文章,自知相见恨晚,虽然学习曲线日趋离谱。但是谁叫我们生在这个时代呢?不过短时间内,虽然也不想干别的,但还是要学点基础看看的。目录一、概念1.面向对象和面向过程2、面向对象三大特征二、集合List集合Set集合Map集合三、异常四、IO五、继承和接口一、概念1...

2021-09-22 11:09:23 70

原创 Kaggle大学之SQL提高篇

目录第一节:joins and unions练习1:每个问题收到回答需要多久练习2:查找提出问题但没有提供答案的客户练习3:两个join练习4:查询某日有多少用户发布信息(必须用UNION)第二节:分析函数第三节:第四节:第一节:joins and unions介绍:使用的素材是两个表,一个是主人信息表,一个是宠物信息表。两个表依靠宠物的id来链接。往常我们使用的是inner join如今我们使用的是left join ,而left join 的意思就是我

2021-09-21 23:02:14 536

原创 R语言学习之不怕失败永远向上

Rstudio实在是太丑了,我换成了Pycharm可是总会遇到一些问题。我觉得问题出在我的计算基础基础知识不过关。问题1:argument encoding="UTF-8" is ignored in MBCS locales在MBCS区域设置中忽略参数encoding=“UTF-8”加了encoding之后问题二:invalid multibyte character in parser at line 14第14行解析器中的多字节字符无效由于我想要选择参数来指定列名...

2021-09-19 14:52:03 1282 2

原创 面试好题:SQL学习客户单量分布

总觉得自己sql没问题,因为没有实际项目,而且sql的很多思路和Python大同小异。但是实际一上手还是不行,今天就掏出来一个SQL题来进行全面分解。这个题我觉得出的非常好,考察面非常广既然来都来了,今天就要学大个的,把整个流程学下来一、创建一个揽收表打开navicat新建表新增三行:运单号,客户id,创建日期数据类型:varchar,varchar,datetime主键:订单号命名:揽收表二、插入数据单量分布设置三个区间0-2 3个客户3-5 2个.

2021-09-16 12:13:08 3094 1

原创 kaggle大学之机器学习(灌水帖)

kaggle真是一个好网站,这里的微课虽然内容非常少,但是却是有着学习加训练的闭环。每次学习都能从实际例子中让我真正学到东西。好了废话不多说,今天继续冲机器学习的微课。sql已经学完了,sql提高不打算看,因为这些操作可以在更便捷的编程语言上学习到。机器学习入门看了一半,不过不理解数据使得我止步了。但是今天我要重返这里,征服机器学习的高峰。机器学习搞完看pandas和数据可视化模块。目录一、模型是怎么运作的二、基本数据探索EDA三、你的第一个机器学习模型选择数据:查看一下列名

2021-09-15 17:00:22 400

原创 kaggle网站sql学习微课

目录开始sql之旅练习1:数一数数据集里表的个数练习2:探索表的概要练习3:创建一个犯罪地图Select/From/Where开始sql之旅对你的新数据探索技能的第一次测试使用的是描述芝加哥市犯罪的数据。1、创建客户机对象检索信息教程说,你很快就会看到这个客户机对象将在从BigQuery数据集中检索信息方面发挥中心作用。反正我觉得挺迷的client=bigquery.Client()2、首先使用dataset()方法构造对dataset的引用。da..

2021-09-14 20:19:26 320

原创 保安日记 8.30

下载启动独立操作伪分布式操作全分布式操作

2021-08-31 22:51:56 54

原创 保安日记Hadoop 8.29

上次卡到了如何配置Hadoop(好像约等于没有进度......)不过CSDN写的博客还是有点不够全面,有的地方我不懂,也没有人来解释。因此我找到了一个更好的办法,阅读官方文档,还能提高英文阅读能力呢。咱们先从第一条开始学习吧,不能一口吃成一个胖子不是。目录Hadoop设置单节点集群先决条件下载启动独立操作伪分布式操作全分布式操作Hadoop设置单节点集群先决条件支持的平台:感觉对于数据库人员来说Linux才是主流的生产力平台,而Windows只是普通办公使

2021-08-29 20:54:25 128

原创 保安日记8.28--Hadoop入门

昨天在centos中下载好了hadoop压缩包,今天看看能到哪一步。因为是Linux系统感觉只能用命令行那么一点点写代码,先看看吧。hadoop需要集群部署,服务器和节点IP地址的设置,需要改名改ip,Ping通,DNS解析。这些是什么鬼我真的不太懂。一点点学吧,所谓基础不牢,地动山摇。目录集群部署搭建思路1、部署服务器2、节点地址规划3、每节点资源规划4、系统账号和密码5、节点功能规划6、节点文件目录规划环境准备集群部署先来了解集群部署:搭建思路

2021-08-28 21:37:09 118

原创 会计转行保安日志8.27

会计很难做做审计很累经常出差工作重复做公司财务要么成螺丝钉要么担风险做投行要硕士学历而且只能在大城市(生活成本太高)因此我走上了另一条路,erp相关的财务bp,让我去做软件开发是不可能的(太难了),让我去做项目落地也不太现实,有什么技术含量呢?人活这一辈子,就要干点大事!目前想法是做个数据分析或者数据开发数据中台啥的。目前简历上有一份医院药品销售分析的项目,用python做的,目前最新的成果是pyecharts实现了一个动态排序(调参)这个是会动的,但是我不知道怎么能让他插入博客

2021-08-27 21:44:31 113

原创 Python朝阳医院AttributeError: ‘tuple‘ object has no attribute ‘sum‘

在使用python进行朝阳医院2018年药品销售前10的数据提取时出现了AttributeError: 'tuple' object has no attribute 'sum'#聚合统计各种药品数量medicine = groupDF[['商品名称','销售数量']]bk = medicine.groupby('商品名称')[['销售数量']]re_medicine = bk.sum()由于我是在练中学,所以并不清楚这是个什么作用的代码,但一路抄过来也明白这是一个类似于sql中提取需

2021-07-23 13:17:49 1588 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除