Python
lisonzhao
轨迹挖掘
展开
-
python 手写kmeans聚类算法
看到一些面经中出现了手写K-means,因此自己写了一版,如有错误,欢迎指正。输入:raw_data: list()(例如,多个坐标点[[0, 0], [1,1],…])k:簇的个数mse_limit:若更新中心点后的mse和更新前的mse,误差在该值以内,则停止迭代early_stopping:最大迭代次数输出:聚类后的结果:dict(),(例如: {0: [[-0.2, -0.2], [0.1, 0.3], [0.2, 0.2], [0.2, 0]], 1: [[-0.1, 1]],原创 2020-07-14 20:04:40 · 2386 阅读 · 1 评论 -
python 快排优化版加随机数实现
经典快排存在的问题:若N个数原来就已经按照规定要求排好序,那么使用快排比较次数会达到最大,复杂度会达到最坏的情况O(n2n^2n2),因此引入随机数,以防止该情况出现# 快排优化版加随机数import randomdef quick_sort(arr,start, end): if start < end: p = partition(arr, start, end) quick_sort(arr, start, p-1) quick_so原创 2020-07-13 22:11:27 · 555 阅读 · 0 评论 -
python爬虫在windows中能爬取网页数据,但部署到linux环境中时无法获取数据问题的解决
本人在python爬虫时遇到了在windows中能爬取网页数据,但部署到linux环境中时无法获取数据 的问题, 检查后发现是BeautifulSoup解析问题。解决方法:BeautifulSoup的解析器问题,即把lxml 替换为 html.parser将soup = BeautifulSoup(html, &quot;lxml&quot;)替换为:soup = BeautifulSoup(html,...原创 2018-11-12 10:52:16 · 2411 阅读 · 0 评论 -
python数据预处理之特征缺失值和异常值处理
python对数据预处理过程中缺失值或异常值的处理,可以使用sklearn.impute包中的 SimpleImputer# 引入SimpleImputer包import pandas as pdfrom sklearn.impute import SimpleImputer'''详解:https://scikit-learn.org/dev/modules/generated/skle...原创 2019-03-14 14:31:31 · 5063 阅读 · 2 评论 -
轨迹坐标点网格化生成对应的网格ID python实现
需求:划分坐标区域,GPS坐标点网格化处理输入:GPS坐标经纬度,网格的行数和列数输出:坐标的网格区域ID区域范围import pandas as pdimport randomLON1 = 121.4135 LON2 = 121.4176LAT1 = 31.2165LAT2 = 31.3233随机生成100个范围内的坐标点lon =[] lat =[] for i i...原创 2019-05-17 22:08:18 · 10271 阅读 · 14 评论