自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 【写给小白】Anaconda+Pycharm保姆级环境搭建教程(2024年最新)

作者学习python之初,环境配置成为一个拦路虎,也因此对编程学习有了不太容易的印象。结合近日为朋友配置环境的机会,形成本篇文档,以一步一图的形式向新手同学展示如何搭建anaconda+pycharm环境,相比视频教学,保留了教程的细致性,提高了教程的可阅读性。

2024-01-03 13:54:10 27350 4

原创 【爬虫学习笔记】三、BS4 & Xpath & pyquery & parsel 基础使用

在上一篇笔记【爬虫学习笔记】二、代理与代理池的使用中,我们学会了如何使用代理池,但笔者在记录学习使用过程中由于半路出家的原因,基础并不扎实,因此想要巩固几个在爬虫中常用的数据解析库的使用方法。在此之前,需要具备一些简单的html&css知识,了解web网页基础。本篇文章的内容相对简单,不必专门学习,随用随看可能会更加高效。大约阅读时长为10分钟。BS4 & Xpath & pyquery & parsel的基本用法本案例对应的学习内容为《python3网络爬虫开发实战》第二版中第3章的内容...

2022-08-02 20:49:44 347 1

原创 【数据挖掘】线上商城用户购买倾向预测挑战赛

电子商务作为数字经济中规模最大、表现最活跃、发展势头最好的新业态新动能,是新发展格局蓝图中非常重要的一环。在保持高速发展的同时,如何从历史数据中找出规律,去预测用户未来的购买需求,让最合适的商品遇见最需要的人,是大数据应用在精准营销中的关键问题,也是所有电商平台在做智能化升级时所需要的核心技术。如何使用机器学习来识别最有价值的潜在客户成为挑战。面对如此头疼的问题,某电商平台将部分用户行为数据开放,诚邀大家帮助他们建立用户购买倾向预测模型来预测用户是否下单购买(敏感信息已脱敏)。给定某电商平台实际业务中的用户

2022-07-11 23:45:00 737 2

原创 【数据挖掘】电信客户流失预测挑战赛

随着市场饱和度的上升,电信运营商的竞争也越来越激烈,电信运营商亟待解决减少用户流失,延长用户生命周期的问题。对于客户流失率而言,每增加5%,利润就可能随之降低25%-85%。因此,如何减少电信用户流失的分析与预测至关重要。鉴于此,运营商会经常设有客户服务部门,该部门的职能主要是做好客户流失分析,赢回高概率流失的客户,降低客户流失率。某电信机构的客户存在大量流失情况,导致该机构的用户量急速下降。面对如此头疼的问题,该机构将部分客户数据开放,诚邀大家帮助他们建立流失预测模型来预测可能流失的客户。给定某电信机构实

2022-07-09 09:00:00 801 1

原创 【爬虫学习笔记】一、利用简单知识完成一次基础爬虫实践

本文通过一次基础的上手实践介绍了爬虫的基本逻辑和基础内容。大约阅读时长为15分钟。对于新手而言,可以收获:你需要做的准备有:本案例的需求为抓取某网站中的文件,以便后续对文件进行文本分析、主题分类、区域偏向分析与各地发布进度等分析。包含序号、标题、字号、发文日期等内容,页面底端有序号。按下Carl+Shift+I,打开开发者工具,查看本页面代码,如下截图:1. 查看列表页文件内容,class="content-bottom-title"属性中存放表头内容,class="list-content"属性中

2022-07-05 09:39:43 288

原创 MySQL基础-学习笔记

MySQL基础一、DQL语言的学习1.基础查询/*语法:select 查询列表 from 表名特点:1-查询的结果集是一个虚拟表2-select类似于System.out.printIn(打印内容) select后面跟的查询列表,可以有很多个部分组成,中间用逗号隔开 例如:select 字段1,字段2,字段3 from 表 System.out.printIn()的打印内容只有一个3-执行顺序select first_name from employees222; a. fr

2020-05-25 20:15:21 360

原创 Git快速使用指南

软件安装网址:https://git-scm.com/在官网下载好软件后,直接安装就好了。使用点击打开git bash首次打开需要设置一下,输入$ git config --global user.name "Name"$ git config --global user.email "email"Name和email替换成自己的,相当于自报门户本地的git仓库可以自己在...

2020-04-03 12:09:55 174

原创 Used-car-Task-4

建模调参学习目标了解常用机器学习模型掌握机器学习建模流程调参流程学习内容线性回归模型:线性回归对于特征的要求;处理长尾分布;理解线性回归模型;模型性能验证:评价函数与目标函数;交叉验证方法;留一验证方法;针对时间序列问题的验证;绘制学习率曲线;绘制验证曲线;嵌入式特征选择:Lasso回归;Ridge回归;决策树;模型对比:常用线性模型;...

2020-04-03 10:56:54 239

原创 Used-car-Task-3

简介天池 数据挖掘入门-二手车交易价格预测地址 https://tianchi.aliyun.com/competition/entrance/231784/information目标 特征工程

2020-04-03 10:09:44 235

原创 Used-car-Task-2

简介天池 数据挖掘入门-二手车交易价格预测地址 https://tianchi.aliyun.com/competition/entrance/231784/information目标 探索性数据分析了解数据集结构及特征了解变量间关系,以及变量与预测值间的关系探索性数据分析形成图表步骤载入各种数据科学以及可视化库:数据科学库 pandas、numpy、scipy;可视化库...

2020-04-03 10:01:20 151

原创 快速学习《精通特征工程》上(1-6章)思维导图知识点总结

内容简介目标:通过思维导图快速建构特征工程思维体系内容介绍:只有知识框架,在PCA部分不够详细,建议阅读原书。机器学习流程两句话理解特征工程:特征工程其实就是用来探索对解决问题有意义的特征的步骤。这些特征在之后的步骤里则会用来训练模型。特征和模型位于原始数据和我们想得到的知识之间数学基础文本数据特征缩放的效果分类变量数据降维PCA...

2020-04-02 14:23:54 585

原创 Used-car-Task-1

简介天池 数据挖掘入门-二手车交易价格预测地址 https://tianchi.aliyun.com/competition/entrance/231784/information目标 赛题理解赛题概况二手车交易记录,一共31列变量信息,15列为匿名数据。评价标准MAE(Mean Absolute Error):赛题分析典型回归问题使用探索性数据分析经验摘要这里是...

2020-03-21 13:17:33 568

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除