数据挖掘
文章平均质量分 88
与机器学习专栏不一样的是,数据挖掘专栏是以具体项目实践为基础的技能和方法论提炼,具有很好的实战参考价值。
三行数学
努力做一个数学与数学工程学布道者,欢迎关注,加入交流群,关注“三行数学”公众号。
展开
-
base上海,数据科学,数据挖掘,数据分析等岗位求收留
裁员了,base上海,数据科学,数据挖掘,数据分析等岗位,原创 2024-06-10 11:55:27 · 1513 阅读 · 0 评论 -
统计某员工非工作时间范围内的时长
朋友李易柯脚受伤了,公司借此机会和朋友协商解除劳动合同,现在朋友需要我帮他统计出一份他非工作时间的聊天记录以作为认定其加班事实的证据,给我发了一份csv数据,有对话分组名,微信帐号 ,时间,消息类型, 消息内容等字段。感觉很多被辞退的朋友如果要去劳动仲裁可能都需要去统计自己加班时长来获取报酬,所以记录在这里以便使用。原创 2024-05-21 16:52:58 · 282 阅读 · 0 评论 -
数据科学——Pipeline
数据科学——Pipeline原创 2022-10-24 10:33:19 · 4296 阅读 · 0 评论 -
轨迹纠偏及高德和百度的webapi请求示例
轨迹纠偏及高德和百度的webapi请求示例原创 2023-11-13 11:37:52 · 608 阅读 · 0 评论 -
Linux常用命令
随着开发工作的的深入,越来越多的用到云和Linux系统,这篇博客主要记录鄙人用过的一些Linux命令,以便熟能生巧,前期不准备做分类,后期积累到一定程度会分类。原创 2022-07-19 16:39:59 · 147 阅读 · 0 评论 -
基于夹角余弦计算轨迹相似度
基于夹角余弦计算轨迹相似度原创 2023-08-30 15:41:13 · 369 阅读 · 0 评论 -
基于DBACAN的道路轨迹点聚类
基于DBACAN的道路轨迹点聚类原创 2023-06-13 20:54:17 · 3364 阅读 · 4 评论 -
向clickhouse插入一段由经纬度构成的路径
三种向clickhouse插入由经纬度构成的路径原创 2023-06-09 22:32:06 · 1223 阅读 · 0 评论 -
航空燃油预测初探
航空燃油预测原创 2021-10-25 20:06:11 · 445 阅读 · 0 评论 -
航空货运数据挖掘那些事|航班换季
航班换季原创 2022-11-28 19:51:27 · 421 阅读 · 0 评论 -
机场气象报文解析
利用python解析机场气象报文原创 2021-08-29 12:01:48 · 9256 阅读 · 3 评论 -
时间序列分析|异常值检测
时间序列异常值检测原创 2022-07-20 22:18:02 · 5491 阅读 · 0 评论 -
时间序列分析|逐步预测与多步预测
一次性多步预测,也可以逐步预测原创 2022-10-26 19:05:34 · 2262 阅读 · 0 评论 -
时间序列分析|数据裁剪和滚动异常值检测
利用时序本身计算出来的统计量进行时序数据裁剪,滚动异常值检测原创 2022-09-18 10:43:03 · 945 阅读 · 0 评论 -
利用时间序列预测电量,冷量和压缩空气量
利用时间序列预测电量,冷量和压缩空气量原创 2023-01-17 14:28:58 · 708 阅读 · 0 评论 -
时间序列分析|基本概念
此乃时间序列分析系列讲义开篇之作,旨在介绍时间序列分析的现实背景和一些基本概念原创 2021-06-25 20:18:43 · 1463 阅读 · 1 评论 -
时间序列分析|时序等间隔处理
时序等间隔处理原创 2021-08-19 21:42:53 · 5576 阅读 · 4 评论 -
时间序列分析|LSTM多变量时间序列预测
基于LSTM多变量的时间序列预测原创 2021-03-27 20:48:44 · 53140 阅读 · 40 评论 -
时间序列分析|auto_arima调参
auto_arima调参原创 2022-07-10 09:59:51 · 9995 阅读 · 3 评论 -
python通过SSH管道访问ClickHouse
python通过SSH管道访问ClickHouse原创 2023-05-06 22:05:44 · 858 阅读 · 0 评论 -
一名合格的机器学习工程师需要具备的5项基本技能,你都get了吗?
数据科学家get5个技能原创 2023-01-21 20:31:06 · 458 阅读 · 0 评论 -
连锁店销量预测
连锁店销量预测原创 2023-02-03 16:51:01 · 1208 阅读 · 1 评论 -
概率密度函数曲线及绘制
概率密度函数曲线原创 2022-11-10 21:41:10 · 9213 阅读 · 0 评论 -
python的LabelEncoder
python的LabelEncoder使用方法原创 2021-10-16 20:07:59 · 16476 阅读 · 0 评论 -
利用neo4j做数据图谱管理数据库表(一)
@TOC背景近几年,随着数据中台的概念迅速红火,越来越多的企业正在或者正在准备打造自己的数据中台,数据中台需要汇集公司全业务流,全生产环节产生的数据,庞大的数据资源进来出去势必对数据的管理提出新的挑战,如何高效便捷的管理好这些数据流也是数据中台建设环节中一项重要且很有意义的基础工作,目前有行业里常用的数据库文档的管理方式有使用excel(word)文档管理;使用powerdesigner管理;在代码中维护或使用sql审核工具如archerry,并且使用pd做反向工程;上面三种管理原创 2021-03-16 22:27:27 · 1977 阅读 · 1 评论 -
利用机器学习将wgs84转到gcj02试探(一)
我们知道机器学习是利用大量的数据资料进行学习的,而这些资料不存在明显的函数关系,更多是相关关系,所以利用机器学习来研究高精度的问题是一个巨大的挑战,日常生活中,我们知道经纬度这个数据一般都需要精确到小数点6,7位,属于高精度的范畴,那么怎么利用机器学习来研究高精度的问题呢?原创 2020-08-02 15:40:51 · 529 阅读 · 0 评论 -
2021年全国重点城市poi数据下载
2019年12月份获取的全国重点城市poi数据提供免费下载,尽可能完备不漏原创 2021-02-01 21:23:05 · 11542 阅读 · 1 评论 -
yagmail发邮件辅助系统(一)
能不能设计一款程序实现自动发送邮件功能,并且该程序分享给朋友,让朋友在没有Python开发环境下也能帮忙发一部分,从诞生了——Python发邮件辅助系统。原创 2019-07-03 21:34:09 · 2025 阅读 · 2 评论 -
魔都地铁租房的时间和租金测算
本次探究以上海1号线,2号线和8号地铁沿线各站点周边1公里平均租金与各站点距离人民广场地铁站的通勤时间为出发点进行数学建模,搭建回归模型,定量分析两者之间的关系,找出两者均衡点。原创 2019-06-28 16:06:20 · 473 阅读 · 0 评论 -
提取pdf里关键信息到mysql
提取pdf里关键信息到mysql背景问题分析操作实施pdf转图片调用ocr接口图片转txt正则提取txt并写入mysql背景本次公司来了一批有关上海物业招标信息文件,原文件是pdf格式的,其中包含可编辑的pdf格式(鼠标能够点进pdf里面)和不可编辑的pdf格式(鼠标点不进pdf里面),现在,要把这些pdf文件里面关键文字信息提取出来,以结构化数据存入mysql里面形成一张招标物业信息表。问题分析相对来说,可编辑的pdf文件好处理,pdfplumber是一个不错的可用模块,然而对于不可编辑的pdf文原创 2020-12-22 13:05:28 · 797 阅读 · 0 评论 -
从logit变换到logistic模型
前面我们知道对数函数和对数函数的一些基本性质,也许你会问,为什么要引入对数函数?而且还是一个基本初等函数?这就要从logit变换说起。原创 2020-03-15 11:35:31 · 12367 阅读 · 6 评论 -
KMeans聚类算法
KMeans聚类算法原创 2020-03-12 15:34:28 · 1603 阅读 · 0 评论 -
python实现2019-nCoV疫情确诊数据拟合与预测
python实现2019-nCoV疫情确诊数据拟合与预测探索这些数据的规律和内在联系了原创 2020-02-06 15:04:11 · 13439 阅读 · 47 评论 -
从地铁刷卡数据到OD矩阵
利用集合论算法解决地铁刷卡记录数据转刷卡人次OD矩阵原创 2019-12-20 10:31:05 · 10134 阅读 · 29 评论 -
pandas空值填充
pandas空值填充,缺失值处理原创 2019-11-14 17:42:32 · 10576 阅读 · 0 评论 -
多指标客观赋权重及熵权法的python实现
指标客观赋权重,熵权法python实现,优缺点原创 2019-11-05 09:23:00 · 3735 阅读 · 2 评论