数据分析
stay_foolish12
本科统计学,研究生计算机应用技术。可以【接 】大学计算机课程设计、课程大作业,C++\C\JAVA\汇编\Golang\PHP等相关语言,MySQL\SQLServer等数据库,Linux操作系统,人工智能、数据挖掘、数据分析、自然语言处理等相关课程均可
展开
-
常见的统计分析方法汇总,指标对比分析、时间序列预测
此外在统计上,许多综合指标是采用价值形态来反映实物总量,如国内生产总值、工业总产值、社会商品零售总额等计算不同年份的发展速度时,必须消除价格变动因素的影响,才能正确的反映实物量的变化。二、分组分析法指标对比分析法是总体上的对比,但组成统计总体的各单位具有多种特征,这就使得在同一总体范围内的各单位之间产生了许多差别,统计分析不仅要对总体数量特征和数量关系进行分析,还要深入总体的内部进行分组分析。因素分析按其所研究的对象的统计指标不同可分为对总量指标的变动的因素分析,对平均指标变动的因素分析。原创 2022-09-28 16:33:09 · 3693 阅读 · 0 评论 -
sql 将整数型 numeric数据转换成date
将整数型的20180909时间转换成日期。原创 2022-09-28 09:11:14 · 1316 阅读 · 0 评论 -
自动机器学习pycaret,手把手教你自动提取特征、自动选取模型、自动评价
手把手教你自动提取特征、自动选取模型、自动评价。原创 2022-08-10 09:44:04 · 970 阅读 · 0 评论 -
机器学习常用的算法整理:线性回归、逻辑回归、贝叶斯分类、支持向量机、K-means聚类、决策树、随机森林以及常用的应用场景整理
什么是机器学习?机器学习是计算机利用已有的数据(经验)得出了某种模型,并利用这些模型预测未来的一种方法。这个过程其实与人的学习过程极为相似,只不过机器是一个可以进行大维度数据分析而且可以不知疲倦地学习的“怪兽”而已。具体的机器学习过程如下:机器学习算法纵览常见的机器学习算法: 产品视角的14种常见算法简单总结决策树无监督机器学习中,最常见4类聚类算法总结 :K-means聚类 Dbscan聚类...原创 2020-12-21 16:56:31 · 2658 阅读 · 4 评论 -
ArchSummit2016干货分享+美团:即时物流调度平台实践+一点资讯:兴趣引擎-深度融合搜索和推荐+阿里-智能问答系统的实践
**2015年7月**加入滴滴打车3个半月,感觉遇到和解决的技术问题超过之前1年的。写在这里给大家分享。滴滴这边负责所有策略算法设计的是“策略组”,大概有20几个员工。由于滴滴的业务线越来越多(出租车,专车,快车,顺风车拼车,大巴),项目上线时间紧,没有时间对策略算法做最好的设计和优化。于是,新成立了一个通用模型组,目标是抽取出不同业务线的共同点,在一个更高的角度设计更好的策略算法,特别是...转载 2019-05-23 09:01:36 · 2351 阅读 · 0 评论 -
滴滴 KDD 2018 论文详解:基于强化学习技术的智能派单模型
国际数据挖掘领域的顶级会议 KDD 2018 在伦敦举行,今年 KDD 吸引了全球范围内共 1480 篇论文投递,共收录 293 篇,录取率不足 20%。其中滴滴共有四篇论文入选 KDD 2018,涵盖 ETA 预测 (预估到达时间) 、智能派单、大规模车流管理等多个研究领域。四篇论文分别是(文末附论文打包下载地址)Efficient Large-Scale Fleet Management vi...转载 2019-05-23 09:19:01 · 4999 阅读 · 1 评论 -
观点 | 滴滴 AI Labs 负责人叶杰平教授:深度强化学习在滴滴的探索与实践+关于滴滴智能调度的分析和思考+滴滴派单和Uber派单对比
AI 科技评论按:7 月 29 日,YOCSEF TDS《深度强化学习的理论、算法与应用》专题探索报告会于中科院自动化所成功举办,本文为报告会第一场演讲,讲者为滴滴副总裁、AI Labs 负责人叶杰平教授,演讲题为「深度强化学习在滴滴的探索与实践」,AI 科技评论对本次演讲内容进行了重点整理。据介绍,现在的滴滴平台每日路径规划请求 400 多亿次,每日新增 100+TB 的轨迹原始数据,每日处理数...转载 2019-05-23 09:29:38 · 4366 阅读 · 0 评论 -
2017年双十一最全面的大数据分析报告在此!+2018年双十一已经开始,厚昌竞价托管教你如何应对流量流失?+2019年双十一大战一触即发:阿里、京东都有哪些套路和玩法
首先说一个众所周知的数据:2017年双十一天猫成交额1682亿。所以今天,从三个角度带你一起去探索1682亿背后的秘密:1、全网热度分析:双十一活动在全网的热度变化趋势、关注来源、媒体来源以及关联词分析。2、各平台对比分析:针对“天猫”“京东”“苏宁”等一些电商平台的销...转载 2019-05-23 10:15:52 · 4640 阅读 · 0 评论 -
## 作为多目标优化的多任务学习:寻找帕累托最优解+组合在线学习:实时反馈玩转组合优化-微软研究院+用于组合优化的强化学习:学习策略解决复杂的优化问题
组合在线学习:实时反馈玩转组合优化看似无比困难的权衡问题,如今组合在线学习就能帮你“算出”最优解,轻松破解传统组合优化问题。本文中,我们邀请到微软亚洲研究院资深研究员陈卫为大家多面解读组合在线学习的奥妙之处。什么是组合在线学习?大家都曾有过这样的经历,在我们刷微博或是阅读新闻的时候,经常会看到一些自动推荐的内容,这些信息可以根据你对推送的点击情况以及阅读时间等来调整以后的推送选择。再比如,手...转载 2019-05-23 10:24:05 · 10369 阅读 · 0 评论 -
干货 | 机器学习算法在饿了么供需平衡系统中的应用
干货 | 机器学习算法在饿了么供需平衡系统中的应用image:url(https://ask.qcloudimg.com/avatar/1292807/6341kxs4h2.png?imageView2/2/w/72)">用户1292807发表于携程技术中心订阅830作者简介陈宁,饿了么人工智能与策略部高级算法专家,负责供需平衡系统的算法与研发工作。获新加坡南洋理工大学计算机博士学位,研究...转载 2019-05-23 10:44:02 · 1991 阅读 · 0 评论 -
数据挖掘算法(logistic回归,随机森林,GBDT和xgboost)-腾讯云社区
机器学习就是样本中有大量的x(特征量)和y(目标变量)然后求这个function。(了解更多可以看: https://zhuanlan.zhihu.com/p/21340974?refer=mlearn )求函数的方法,基于理论上来说,大部分函数都能找到一个近似的泰勒展开式。而机器学习,就是用数据去拟合这个所谓的“近似的泰勒展开式”。实际面试时很看重和考察你的理论基础,所以一定一定要重视各个算法推...转载 2019-05-23 10:53:08 · 1629 阅读 · 0 评论 -
出行大数据,滴滴发布400城数据可视化分析
转 一:出行大数据,滴滴发布400城数据可视化分析 2018年01月04日 00:00:00https://blog.csdn.net/zw0Pi8G5C1x/article/details...转载 2019-05-18 10:53:33 · 21803 阅读 · 1 评论 -
这十套练习,教你如何使用Pandas做数据分析
这十套练习,教你如何用Pandas做数据分析¶Pandas是入门Python做数据分析所必须要掌握的一个库。本文内容由科赛网翻译整理自Github,建议读者完成科赛网 从零上手Python关键代码 和 Pandas基础命令速查表 教程学习的之后,点击本篇Notebook右上角的 Fork 按钮对本教程代码进行调试学习。转载本文请联系 科赛网 取得授权,科赛网 是聚合数据人才和行业问题...转载 2019-06-03 20:00:26 · 2689 阅读 · 0 评论 -
用Python寻找最优投资组合
原文地址:https://www.jianshu.com/p/2a25dfd465e9 现代投资组合理论(Modern Portfolio Theory,MPT)告诉我们投资者应该分散投资来实现最小化风险最大化投资回报。大邓刚开始学习这方面知识,用了将近一天的时候才搞懂MPT理论的推导,顺便复习了部分高中数学知识,这样会让我们更加有新信心的去使用自己编写的代码。现在我们从...转载 2019-07-26 10:11:24 · 16265 阅读 · 5 评论 -
商汤科技-数据运维工程师-提前批笔试题目汇总
2019年8月19日问答题1:缺失值数据预处理有哪些方法?https://juejin.im/post/5b5c4e6c6fb9a04f90791e0c处理缺失值的方法如下:删除记录,数据填补和不处理。主要以数据填补为主。1 删除记录:该种方法在样本数据量十分大且确实值不多的情况下非常有效。2 数据填补:插补大体有替换缺失值,拟合缺失值,虚拟变量等操作。替换是通过数据中非缺失数据的相似性...原创 2019-08-20 09:35:18 · 659 阅读 · 0 评论 -
写给运营同学和初学者的SQL入门教程
作者简介多肉,饿了么资深python工程师。曾在17年担任饿了么即时配送众包系统的研发经理,这篇文章最早的版本就诞生于那段时间,目前负责配送相关业务系统的整体稳定性建设。个人比较喜欢c和python,最近有点迷rust,同时还是个archlinux的日常用户,有类似爱好的欢迎交流PrefaceIntroduction1 预备知识1.1 数据库和数据表1.2 最基本的Sql查询语...转载 2019-05-17 12:44:26 · 4337 阅读 · 2 评论 -
数据分析师基本技能——SQL
我们做数据分析工作时,多数数据来源于数据库,SQL非常方便我们访问和查询数据库。SQL 作为数据分析师的基本技能,那么需要掌握哪些SQL核心技能理解数据库SQL基础重点知识:查询,更新,提取,插入,删除等数据操作 典型实例sql1.理解数据库数据库基本定义:数据库(Database)基本含义为:存储数据的地方,确切地来说是一张张表格,每张表通过一定联系链接在一起,最后组成了数据库可以简单的理解为:...转载 2019-05-17 12:40:01 · 7571 阅读 · 0 评论 -
R语言ggplot2绘图——柱状图
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_34023608/article/details/51852211 </div> <link rel="stylesheet" href="https://csdnimg.cn...原创 2019-05-26 09:11:18 · 22516 阅读 · 2 评论 -
第四届泰迪杯数据挖掘大赛
<script src="//g.alicdn.com/aliyun/goldeneye-deploy/0.0.1/static/goldeneye.js"></script><link rel="stylesheet" href="//at.alicdn.com/t/font_422887_vrqbpml6oos.css"> ...转载 2019-04-05 11:19:20 · 3732 阅读 · 0 评论 -
经典的K-means聚类算法
原理部分主要来自大牛zouxy09和trnadomeet两个人的博客;后面的代码详细讲解为自己精心编写一、概述 非监督学习的一般流程是:先从一组无标签数据中学习特征,然后用学习到的特征提取函数去提取有标签数据特征...转载 2019-04-05 15:30:24 · 2315 阅读 · 0 评论 -
聚类算法当中的K-means算法如何去做天猫淘宝的推广任务
5 人赞同了该回答figure data-size="normal"> data-size="normal">这个入口是全网人气新品池,我们今天所获取到的数据都是来源于这里。无论是C店还是B店,统统都有机会进来。这个平台最有价值的数据,就是可以告诉我们自己的新品究竟算是什么品质的,俗称档次,如图所示不同档位的产品,,平台的推荐力度不同,并且这里是达人们经常选品的地方,如果能进来这里,实...转载 2019-04-05 15:42:46 · 1521 阅读 · 0 评论 -
深度学习如何应用在广告、推荐及搜索业务?阿里妈妈实践案例解读
</span></ul> <div class="markdown-body"> <div id="meta_content" class="rich_media_meta_list"> </div> 阿里妹导读:靖世,阿里妈妈精准展示技术研究员。2011 年,刚...转载 2019-04-05 17:18:18 · 462 阅读 · 0 评论 -
注意力机制-深度学习中的注意力机制+注意力机制在自然语言处理中的应用
1 深度学习中的注意力机制https://mp.weixin.qq.com/s?__biz=MzA4Mzc0NjkwNA==&mid=2650783542&idx=1&sn=3846652d54d48e315e31b59507e34e9e&chksm=87fad601b08d5f17f41b27bb21829ed2c2e511cf2049ba6f5c7244c6e...转载 2019-04-12 10:37:41 · 1465 阅读 · 0 评论 -
【TensorFlow】优化方法optimizer总结(SGD,Adagrad,Adadelta,Adam,Adamax,Nadam)解析(十三)
本文仅对一些常见的优化方法进行直观介绍和简单的比较,主要是一阶的梯度法,包括SGD, Momentum, Nesterov Momentum, AdaGrad, RMSProp, Adam。 其中SGD,Momentum,Nesterov Momentum是手动指定学习速率的,而后面的AdaGrad, RMSProp, Adam,就能够自动调节学习速...转载 2019-04-17 09:17:42 · 1378 阅读 · 0 评论 -
Python pandas数据分析中常用方法
官方教程读取写入文件官方IO读取 写入read_csv to_csvread_excel to_excelread_hdf to_hdfread_sql to_sqlread_...转载 2019-04-14 11:03:10 · 1747 阅读 · 0 评论 -
python数据分析与机器学习(Numpy,Pandas,Matplotlib)
机器学习怎么学?机器学习包含数学原理推导和实际应用技巧,所以需要清楚算法的推导过程和如何应用。深度学习是机器学习中神经网络算法的延伸,在计算机视觉和自然语言处理中应用更厉害一些。自己从头开始做笔记。机器学习怎么动手,哪里去找案例?最好的资源:github ,kaggle案例积累的作用很大,很少从头去写一个项目。先学会模仿,再去创作。...转载 2019-04-22 16:09:17 · 3838 阅读 · 0 评论 -
Python中输入和输出
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/xiaokang123456kao/article/details/73009480 </div> <link rel="stylesheet" hre...转载 2019-04-27 10:45:06 · 32081 阅读 · 1 评论 -
k-means+python︱scikit-learn中的KMeans聚类实现( + MiniBatchKMeans)
版权声明:博主原创文章,微信公众号:素质云笔记,转载请注明来源“素质云博客”,谢谢合作!! https://blog.csdn.net/sinat_26917383/article/details/70240628 </div> <link rel=...转载 2019-04-27 10:48:38 · 2769 阅读 · 0 评论 -
使用sklearn做单机特征工程
目录1 特征工程是什么?2 数据预处理 2.1 无量纲化 2.1.1 标准化 2.1.2 区间缩放法 2.1.3 标准化与归一化的区别 2.2 对定量特征二值化 2.3 对定性特征哑编码 2.4 缺失值计算 2.5 数据变换 2.6 回顾3 特征选择 3.1 Filter 3.1.1 方差选择法 3.1.2 相关系数法 3.1.3 卡方检验 ...转载 2019-04-28 16:04:11 · 121 阅读 · 0 评论 -
Kaggle入门,看这一篇就够了
New Update:之前发表了这篇关于 Kaggle 的专栏,旨在帮助对数据科学( Data Science )有兴趣的同学们更好的了解这个平台。专栏发表至今收到了不少的关注和肯定,还有很多小伙伴私信相关的问题。因此,我特邀了一位海外一线 Data Scientist(有丰富的kaggle参赛经验)在知乎上开了live(时间:4/27 21:00)。希望通过live互动的形式,帮大家更系统了解K...转载 2019-04-28 16:07:29 · 419 阅读 · 0 评论 -
50个数据可视化最有价值的图表(附完整Python代码,建议收藏
50个数据可视化最有价值的图表(附完整Python代码,建议收藏)(上) <!-- 作者区域 --> <div class="author"> <a class="avatar" href="/u/474e739f391e"> <img src="//upload.jianshu.io/user...转载 2019-05-21 08:49:17 · 1265 阅读 · 0 评论 -
活用这23种图表,让你的数据分析胜人一筹 | 推荐收藏
活用这23种图表,让你的数据分析胜人一筹 | 推荐收藏https://www.jianshu.com/p/de73789504cf?utm_campaign=haruki&utm_content=note&utm_medium=reader_share&utm_source=weixin...转载 2019-05-21 08:55:23 · 558 阅读 · 0 评论 -
用excel做数据分析
我们先来看看某公司全国产品销售的报表(截取了部分)某公司全国产品销售的报表通过货品销售数据案例,需反映如下结果:货品销售情况货品交货情况销售货品结构构成货品销售区域构成货品按时交货与合格品综合评价我们使用 excel 进行数据分析,一般有以下步骤需求收集数据整理数据简单统计图表展示分析结果撰写报告第一...转载 2019-04-05 11:00:55 · 5011 阅读 · 0 评论