![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python数据分析
python数据分析
佩瑞
晚安,玛卡巴卡。
展开
-
简单筛选以及可视化分析的笔记整理
数据分析总结本文所做的是一个基于给定的定义并进行数据筛选以及可视化的数据分析不涉及数据挖掘算法1. 数据的采集在导出原始数据前先要观察原始数据的结构,大致确定筛选的主方向,此过程极为重要,筛选的主方向一开始确定的对了话可以省去许多不必要的力气。2.原始数据的预处理提取所需要的原始数据,替换异常值为均值,并根据需要进行降噪(平滑处理)#提取中心点和尾根的角速度以及移动距离import numpy as npimport pandas as pdx_pre=[]excel_path = r原创 2020-09-06 13:13:32 · 472 阅读 · 0 评论 -
数学建模笔记一数据标准化
贝叶斯分类器原创 2020-09-02 14:36:19 · 5588 阅读 · 0 评论 -
数据清洗笔记整理
data cleaning 基础笔记整理pandas中用于替换某一类字符df.replace('-',np.nan,inplace=True)pandas Dataframe提取方法#loc只能通过index和columns来取,不能用数字df.loc['one','a']#one行,a列df.loc['one':'two','a']#one到two行,a列df.loc['one':'two','a':'c']#one到two行,a到c列df.loc['one':'two',['a','c原创 2020-08-30 10:02:13 · 328 阅读 · 0 评论 -
基于Arcgis的社区医院选址实验
基于Arcgis的社区医院选址实验本文是想基于有关社区医院选址文件的描述来设定一些诸如离居民小区的距离、离地铁公交站距离,离娱乐区域的距离等参数,对一个随机选取的实验区域进行模拟选址,随后与真实选址进行对比,进而得出社区医院选址的合理性第一步-选定实验区域先选定北京的顺义区作为大的实验区域,以下步骤在Arcgis中实现1.打开arcmap 添加北京市的shp文件2.查看shp文件的地理坐标系(属性的源里面,一般为GCS_WGS_1984)3.在连接文件夹里新建shapefile面要素4.选择同原创 2020-08-09 22:02:46 · 4316 阅读 · 0 评论 -
标准化处理之后的问卷数据预处理
标准化处理之后的问卷数据预处理标准化处理之后的问卷如下图所示,本文主要聚焦于多选题的分析此时想要收集选每个选项的人数以作后续分析1.导入excel数据import pandas as pddf = pd.DataFrame(pd.read_excel('C:/Users/15643/Desktop/wenjuan.xls'))j=0x_pre1 = []x_pre2 = []2.构建for循环遍历excel里每一个选项列,并对每一个选项进行计数for i in range(1,8):原创 2020-08-08 22:39:22 · 1375 阅读 · 0 评论 -
python抓取北京所有社区医院经纬度
python抓取北京所有社区医院经纬度第一步先从北京政府的官网上获取了有北京所有社区医院信息的excel表格,然后利用pandas库将name列提取出来并转换为list对象from pandas import DataFramedf = pd.DataFrame(pd.read_excel('C:/Users/15643/Desktop/hospital_data.xls'))data_set = np.array(df['name'])data_set_lists = data_set.tol原创 2020-08-08 22:05:32 · 1175 阅读 · 1 评论