数据分析和挖掘
文章平均质量分 59
one named slash
Bullet for My Valentine
展开
-
Mysql8.0开启远程访问权限
use mysql; --登录后选择mysql数据库select host,user,password from user; --查看当前root对应host是否为 %update user set host = '%' where user = 'root'; --更新select host,user,password from user;grant all on *.* to 'root'@'%' with grant option; -- 授权flush privilege.原创 2021-09-09 10:55:58 · 486 阅读 · 0 评论 -
NO.90——京东用户购买意向预测之数据预处理
1 目标使用京东多个品类下商品的历史销售数据,构建算法模型,预测用户在未来5天内,对某个目标品类下商品的购买意向。2 数据集这里涉及到的数据集是Kaggle上京东数据集:JData_User.csv 用户数据集 105,321个用户JData_Comment.csv 商品评论 558,552条记录JData_Product.csv 预测商品集合 24,187条记录JData_Act...原创 2020-03-13 10:54:23 · 2154 阅读 · 0 评论 -
NO.89——应用Xgboost进行保险赔偿预测
文章目录1 数据分析1.1 先瞅瞅数据长啥样1.2 连续变量和分类变量1.3 分类变量中属性的个数1.4 赔偿值1.5 连续变量特征1.6 特征之间的相关性2 Xgboost2.1 数据预处理2.2 简单的Xgboost模型2.3 第一个基础模型2.4 Xgboost参数调节3 总结我的github地址.1 数据分析import pandas as pdimport numpy as np...原创 2020-03-12 11:12:15 · 769 阅读 · 1 评论 -
NO.88——数据分析之玩转Kaggle的究竟是一帮什么人?
1 前言1.1 数据领域的兄弟们的自身情况性别比例调查问卷国家分布年龄分布收入情况所学专业从事领域工作满意度最常使用工具常用算法计算平台选择面临挑战1.2 Python和R哪家强使用人数常用工具不同工种偏好各大领域使用趋势薪资待遇用了多少年重要程度1.3 数据科学家都在用什么国家分布使用Python or R工资与学历如何证明自己呢遇到...原创 2020-03-11 17:07:32 · 532 阅读 · 0 评论 -
NO.87——特征数据预处理-标准化和归一化
标准化对原始数据进行预处理,少不了进行standardizition(或者叫 Z - Score - Nomalizition)。要求均值 ????=0 和标准差 ????=1,转换公式如下:这个意义是十分重大的,想象一下,我们经常通过梯度下降来进行优化求解,公式一般如下,如果特征之间的数值差异太大,那么更新的结果肯定也会产生较大的差异,这是我们所不希望的。在最开始的时候,我们认为特征之间的重要程...原创 2020-03-07 16:52:25 · 695 阅读 · 0 评论 -
NO.86——数据挖掘 泰坦尼克号获救分析
数据挖掘流程(一)数据读取读取数据,并进行展示统计数据各项指标明确数据规模与要完成的任务(二)特征理解分析单特征分析,逐个变量分析其对结果的影响多变量统计分析,综合考虑多种情况影响统计绘图得出结论(三)数据清洗与预处理对缺失值进行填充特征标准化/归一化筛选有价值的特征分析特征之间的相关性(四)建立模型特征数据与标签准备...原创 2020-03-07 10:33:11 · 394 阅读 · 0 评论 -
NO.83——macOS下MongoDB的安装与配置
安装极其推荐Homebrew安装,非常方便快捷。我安装的是4.2社区版,一开始,我直接brew install mongodb无法安装,原来是mongodb并没有集成在homebrew的包库里,所以首先要把mongodb添加到包库:brew tap mongodb/brew然后,brew进行安装brew install mongodb-community@4.2之所以推荐br...原创 2020-02-20 19:52:46 · 199 阅读 · 0 评论 -
NO.47-------线性回归分析经典案例(汽车价格预测)
数据集简介主要包括3类指标:汽车的各种特性. 保险风险评级:(-3, -2, -1, 0, 1, 2, 3). 每辆保险车辆年平均相对损失支付.类别属性make: 汽车的商标(奥迪,宝马。。。) fuel-type: 汽油还是天然气 aspiration: 涡轮 num-of-doors: 两门还是四门 body-style: 硬顶车、轿车、掀背车、敞篷车 drive-...原创 2019-03-09 20:07:12 · 6696 阅读 · 21 评论