睡醒了的小码媛
码龄7年
关注
提问 私信
  • 博客:26,026
    26,026
    总访问量
  • 22
    原创
  • 1,387,940
    排名
  • 18
    粉丝
  • 0
    铁粉

个人简介:数据挖掘路上的点滴积累

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:广东省
  • 加入CSDN时间: 2018-05-07
博客简介:

MISS ZY

博客描述:
数据挖掘路上的点滴积累
查看详细资料
个人成就
  • 获得18次点赞
  • 内容获得1次评论
  • 获得143次收藏
创作历程
  • 1篇
    2020年
  • 13篇
    2019年
  • 8篇
    2018年
成就勋章
TA的专栏
  • Java
    1篇
  • JavaEE
    1篇
  • 机器学习
    9篇
  • 深度学习
    3篇
  • 剑指offer(python)
  • leetcode(python)
  • python数据分析
    9篇
  • 大数据
    3篇
  • SQL
    1篇
兴趣领域 设置
  • 人工智能
    机器学习
创作活动更多

AI大模型如何赋能电商行业,引领变革?

如何使用AI技术实现购物推荐、会员分类、商品定价等方面的创新应用?如何运用AI技术提高电商平台的销售效率和用户体验呢?欢迎分享您的看法

182人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Idea部署Tomcat入门案例(环境配置,常见错误以及客户端向服务端发送请求的方式)

1.首先创建web项目,如果创建时忘记勾选creat web.xml选项,,那么就不会出现web-inf文件夹,需要手动添加,添加如下:2.页面和jsp资源都必须放在web目录下,没有的话就自己手动创建文件夹,只能叫这个名字,不然tomcat 会找不到,报The requested resource is not available错误。3.web.xml为配置文件,servlet...
原创
发布博客 2020.04.14 ·
422 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

python数据挖掘--评估指标

数据挖掘路上滴滴点点,记录下常用评价指标。持续更新。Acc、f1、recall、precisionmetrics_lr = { 'accuracy': accuracy_score(prediction_lr, Y_test), 'f1': f1_score(prediction_lr, Y_test, average="macro"), 'recall': rec...
原创
发布博客 2019.06.07 ·
850 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python数据挖掘--超参寻优篇(附方法和代码)

数据挖掘路上点点滴滴,记录超参优化的常用手段,最近在学习自动化超参寻优,持续更新。1.K折交叉验证参数from sklearn.model_selection import cross_val_score,KFold定义交叉验证规则n_folds = 5rmse=[]def rmsle_cv(model): kf = KFold(n_folds, shuffle=...
原创
发布博客 2019.06.07 ·
1793 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

python数据挖掘---建模篇(附代码)

数据挖掘路上点点滴滴,记录下机器学习常用模型(附代码),持续更新数据划分x_train1, x_test1, y_train1, y_test1 = train_test_split(x, y, train_size=0.8, random_state=14)数据标准化树类模型不需要,使数据符合N(0,1)分布。很多ML的算法要求训练的输入参数的平均值是0并且有相同阶数...
原创
发布博客 2019.06.07 ·
5132 阅读 ·
8 点赞 ·
0 评论 ·
57 收藏

python数据挖掘--特征工程篇(附代码)

记录数据挖掘路上遇到的常用特征工程方法和技巧(附代码),方便自己,方便他人,持续更新。1.哑编码对某一列数据进行pandas自带的(定性数据哑编码,定量数据二值化),并附上名字pd.get_dummies(all['MSSubClass'], prefix='MSSubClass')2.卡方特征选择从已有的特征中选择出影响目标值最大的特征属性常用方法:{ 分类:F统计量、卡...
原创
发布博客 2019.06.07 ·
979 阅读 ·
0 点赞 ·
0 评论 ·
5 收藏

python数据挖掘---数据清洗篇(附代码)

在数据挖掘路上点点滴滴,遇到的数据清洗的一些常用技巧和方法,记录下来,并持续更新。1.01读取数据不要索引,去掉字段前后空格train=pd.read_csv('train.csv',skipinitialspace=True,index_col=0)1.02缺失值处理按列统计缺失值比例,决定去除或者填充all_missing=all_dummies.isnul...
原创
发布博客 2019.06.07 ·
5119 阅读 ·
7 点赞 ·
0 评论 ·
51 收藏

机器学习系列(1)--最全算法概述(附案例)

机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。1.线性回归定义:一种回归模型...
原创
发布博客 2019.02.22 ·
215 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

一文了解卷积家族

参考:https://cloud.tencent.com/developer/news/320941http://blog.csdn.net/zouxy09/article/details/9993371/http://www.36dsj.com/archives/24006http://news.hexun.com/2016-08-08/185382572.htmlhttp:...
原创
发布博客 2019.02.17 ·
233 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

tensorboard可视化

学习笔记参考:https://blog.csdn.net/sinat_29957455/article/details/816386501.使用tf.summary模块:tf.summary.scalartf.summary.graph2.任何地方都可以记录3.xshell启tensorboard -logdir=xxxx,得到链接4.浏览器里打开5.注意全连接成看...
原创
发布博客 2019.02.12 ·
137 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python系列(4)---matplotlib库基础知识

   
原创
发布博客 2019.01.29 ·
196 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python系列(3)---numpy库基础知识

    一、数组的创建:1.常规创建:np.array()2.特殊数组的创建:np.ones(),np.zeros(2,4)创建2行4列的0数组,np.eyes(),单位矩阵dtype:指定数据类型 zeros:创建数据全为0 ones:创建数据全为1 empty:创建数据接近0  3.通过函数创建:np.arange(10,20,2),区间1...
原创
发布博客 2019.01.29 ·
1044 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

深度学习系列--资料篇

学习过程中用到的资料整理如下:书籍 网站 课程 论文后续还会慢慢补充。 1本《深度学习》“圣经”:http://www.deeplearningbook.org/10G深度学习训练数据集:https://pan.baidu.com/s/1HpadkH84YlqFxZ-CJ0WziQ,密码: kzkh20+深度学习论文集合:https://pan.baidu.com/s/...
原创
发布博客 2019.01.27 ·
327 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

python系列(1)---基础知识

基础语法(一  )一、python字符串1.运算符 2.基本数据类型 3.字符串基本运算 4.字符串常用函数  二.python数据结构1.list方法(静态)和操作(动态)创建list()或[]  2.列表推导式:利用其它列表创建新列表,类似for循环,格式:new1=[exper for value...
原创
发布博客 2019.01.27 ·
241 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python系列(2)---pandas库基础知识

pandas是数据清洗常用包,知识点包括数据的创建、数据的操作、数据的计算、数据的索引。脑图如下。一、数据创建:Series,DataFrame1.Series创建的两种方式 :一维数组    或者  字典 2.Series运算 3.dataframe创建的两种方式:数组    或者  字典二、数据的常用操作1.读取文件pd.read_csv...
原创
发布博客 2019.01.25 ·
306 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

推荐系统(二)-协同过滤

 1.协同过滤(CF, Collaborative Filtering)也叫做基于近邻的推荐算法,主要思想是:利用已有的用户群过去的行为或者意见预测数据,根据和当前用户/当前物品比较相似的近邻数据来产生推荐结果,和KNN算法的思想比较类似。主要应用场景是在线零售系统,目的是进行商品促销和提高销售额。算法输入是一个用户-物品评分矩阵,输出的数据一般有两类:当前用户对物品喜欢和不喜欢程度的预测数值...
原创
发布博客 2018.12.18 ·
507 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

推荐系统(一)

1.背景推荐系统是利用网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买的过程。而个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。2.分类推荐系统(Recommender System, RS)是向用户建议有用物品的软件工具和一种技术。RS分为个性化推荐和非个性化推荐两大类:个性化推荐是指基于用户对商品的偏好信息来进...
原创
发布博客 2018.12.18 ·
439 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

SQL初步语法

#Hello worlduse world;Select ID,NAME,COUNTRYCODE,DISTRICT,POPULATIONFROM world.city LIMIT 10;#了解mysqlshow databases;show tables;show columns from city;#排序use world;Select ID...
原创
发布博客 2018.12.17 ·
151 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

VMware虚拟机+centOS(linux系统)重置密码

自己折腾虚拟机,各种配置完成之后第二天忘记密码,难受,香菇,所以把虚拟机重置密码记录下来。环境:VMware虚拟机+centOS(linux系统)1.重启虚拟机2.点击e,进入编辑模式3.将光标一直移动到 LANG=en_US.UTF-8 后面,空格,再追加init=/bin/sh。4.按住CTRL+X执行进入,输入命令passwd root,根据提示输入2次一样的新密码。...
原创
发布博客 2018.11.27 ·
1742 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

最全SPARK环境(集群、windows、linux)的搭建

Spark集群环境搭建    -0. 前提:配置好Hadoop和JAVA的开发环境        -1. 上传Spark和Scala压缩包(到~/software文件夹中)        -2. 解压压缩包    $ tar -zxvf ~/software/spark-1.6.1-bin-2.5.0-cdh5.3.6\(cdh版本已经编译好的\).tgz -C ~/modules/...
原创
发布博客 2018.11.17 ·
2323 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

傻瓜都能会的假设检验

统计推断的基本问题:1.估计问题2.假设检验问题本文先讲假设检验的问题,估计问题会在后面的文章中讨论。假设检验由来: 总体的分布函数完全未知或只知其形式但不知其参数的情况,为了推断总体的的某些未知特性,提出关于总体的假设。这里重点讨论对于正态总体提出数学期望等于u的假设。定义:有样本推断总体的一种方法步骤:1.根据实际问题的要求,提出原假设Ho及备择假设H1;     ...
原创
发布博客 2018.07.11 ·
330 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多