自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 PowerApps 个人笔记

• BrowseScreen,这个一般是用来显示数据列表的,对应数据操作是“查询列表”。• DetailScreen,这个一般是用来显示某条数据的详细信息的,对应数据操作是“查询”。• EditScreen,这个屏幕比较有意思,它一般用来新建数据,或者编辑数据,对应数据操作是“插入”和“更新”。• 普通控件:如文本/控件/多媒体控件/图形控件• 容器控件:主要是通过画布应用构建自己的第一个PowerApps应用Onchange: 触发器Onselect: 点击函数(User),用来获取当前用户的邮箱,

2023-03-22 15:20:17 1425

原创 SAS基础 2021/10 回顾

SAS 2021/10 回顾SAS1.书本知识回顾​ 变量(数值型/字符型/日期型):名称、类型、长度、输入格式、输出格式、标签​ 常量/运算符/表达式/语句1.1 语句数据步: DATA — 数据管理​ 常见:FILE/PUT/LENGTH/LABEL/KEEP/DROP/WHERE/SET/MERGE/BY/RENAME……复制与修改/合并(纵向/横向:先排序SORT+BY)/拆分控制语句:​ 条件:IF-THEN/IF-THEN-DO/IF-THEN-ELSE/SELECT(3

2021-10-18 15:40:29 1497

原创 记录贴: SQL Data Scientist Profiling and Analyzing the Yelp Dataset Coursera Worksheet

Part 1: Yelp Dataset Profiling and UnderstandingYelp Dataset :在网页操作吧1. Profile the data by finding the total number of records for each of the tables below:i. Attribute table = 10000ii. Business table = 10000iii. Category table = 10000iv. Checkin tab

2021-10-09 13:03:18 1891 1

原创 Datawhale | Python办公自动化05--爬虫

Python办公自动化 学习反馈TASK5使用语言:pythonTas1 – Task5Task5题目理解:本次学习主要针对办公过程中的python进行word、excel、pdf的相关操作,了解通过python进行文件批量处理、电子邮件收发、数据爬取。Task05主要是以下几个点:爬虫的概念爬虫的基本使用:爬虫的高级使用爬虫的基础爬虫所需要的库:Requests是一款目前非常流行的http请求库、BeautifulSoup第三方库(更常见)爬虫基本使用:文字、图片信息高级

2021-06-25 16:53:11 176

原创 Datawhale | Python办公自动化 Task04

Python办公自动化 学习反馈TASK1使用语言:pythonTas1 – Task5Task4题目理解:本次学习主要针对办公过程中的python进行word、excel、pdf的相关操作,了解通过python进行文件批量处理、电子邮件收发、数据爬取。Task04—PDF主要是以下几个点:基于多个外接库进行处理初级的 PDF 自动化包括 PDF 文档的拆分、合并、提取等操作,更高级的还包括 WORD与PDF互转等-个人题会这次的task明显比之前的两种难了好多,但是实用性会更强特

2021-06-23 22:10:14 93

原创 Datawhale | Python办公自动化 Task03

Python办公自动化 学习反馈TASK1使用语言:pythonTas1 – Task5Task3题目理解:本次学习主要针对办公过程中的python进行word、excel、pdf的相关操作,了解通过python进行文件批量处理、电子邮件收发、数据爬取。Task03—WORD 主要是以下几个点:认识Python–word的基本结构# 新建空白文档doc_1 = Document()# 添加标题(0相当于文章的题目,默认级别是1,级别范围为0-9)doc_1.add_heading

2021-06-19 19:25:29 136

原创 Datawhale | Python办公自动化02

Python办公自动化 学习反馈TASK2使用语言:pythonTas1 – Task5Task2题目理解:本次学习主要针对办公过程中的python进行word、excel、pdf的相关操作,了解通过python进行文件批量处理、电子邮件收发、数据爬取。Task01主要是以下几个点:使用python对Excel进行读取、写入、样式的处理收获:主要是要了解调用的库:openpyxl学会基础写入、保存、另存为样式的设定:Font(name字体名称,size大小,bold粗体,i

2021-06-18 16:37:12 86

原创 Datawhale | Python办公自动化

Python办公自动化 学习反馈TASK1使用语言:pythonTas1 – Task5Task1题目理解:本次学习主要针对办公过程中的python进行word、excel、pdf的相关操作,了解通过python进行文件批量处理、电子邮件收发、数据爬取。Task01主要是以下几个点:文件与文件路径解释文件及文件夹操作文件读写过程组织文件shutil模块学习:复制粘贴移动删除遍历目录树学习:—还需要再学习!!用zipfile模块压缩文件:自动发送邮件Python有两个内置库:

2021-06-16 22:11:29 121

原创 Datawhale 零基础入门数据挖掘二手车预测task05

Detail 零基础入门数据挖掘 (心跳信号分类) 学习反馈TASK4使用语言:pythonTas1 – Task5Task5模型融合简单加权融合:回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean);分类:投票(Voting)综合:排序融合(Rank averaging),log融合stacking/blending:构建多层模型,并利用预测结果再拟合预测。boosting/bagging(在xgboo

2021-04-24 20:17:27 85

原创 Datawhale 零基础入门数据挖掘二手车预测task04

Detail 零基础入门数据挖掘 (心跳信号分类) 学习反馈TASK4使用语言:pythonTas1 – Task5Task2 mo

2021-04-22 22:25:08 52

原创 Datawhale 零基础入门数据挖掘二手车预测task03

Detail 零基础入门数据挖掘 (心跳信号分类) 学习反馈TASK1使用语言:pythonTas1 – Task5Task2 特征工程分析目标:数据处理操作内容:异常处理、特征归一化/标准化、数据分桶、缺失值处理、特征构造、特征筛选、降维1.学习了本次介绍的关于异常值处理的代码包装模块,感觉大佬还是强2.关于分桶的概念与运用定义:分桶是离散化的常用方法,将连续型特征离线化为一系列 0/1 的离散特征;当数值特征跨越不同的数量级的时候,模型可能会只对大的特征值敏感,这种情况可以考虑

2021-04-19 22:36:50 70

原创 Datawhale 零基础入门数据挖掘二手车预测task02

Detail 零基础入门数据挖掘 (心跳信号分类) 学习反馈TASK1使用语言:pythonTas1 – Task5Task2 EDA-数据探索性分析熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。数据基本情况Train数据集-Test以price为例:展示其数据特征分布系数相关性 )Pearson相关系数-其他可视化类型个人感悟:本次对于数据的可视化练习的比较多;基本的柱状图、小提琴图等等

2021-04-16 22:11:14 67

原创 Datawhale 零基础入门数据挖掘二手车预测task01

Detail 零基础入门数据挖掘 (心跳信号分类) 学习反馈TASK1使用语言:pythonTas1 – Task5Task1赛题理解:本次学习数据挖掘所用到的数据来自某交易平台二手车交易记录,总数据量超过40w,包含31列变量信息,其中15列为匿名变量。Task01主要是以下几个点:对于本次赛题背景知识的...

2021-04-14 00:35:19 92

原创 心跳信号分类-- 学习反馈TASK5

Detail 零基础入门数据挖掘 (心跳信号分类) 学习反馈TASK5使用语言:pythonTas1 – Task5Task5 模型融合模型融合是本次项目也是常规比赛后期一个重要的环节,可以分为:简单加权融合:回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean);分类:投票(Voting)综合:排序融合(Rank averaging),log融合stacking/blending:构建多层模型,并利用预测结果再拟合预测。boo

2021-03-29 00:22:05 96

原创 Datawhale 零基础入门数据挖掘心跳信号分类学习反馈04

Detail 零基础入门数据挖掘 (心跳信号分类) 学习反馈TASK3使用语言:pythonTas1 – Task5Task4 建模与调参本次学习的重点是贪心调参、网格搜索调参、贝叶斯调参共三种调参方法模型对比与性能评估逻辑回归决策树集成模型集成:Bagging和Boosting在个人使用中,常见的是前两个;故对第三种进行详细学习:Bagging和Boosting都是将已有的分类或回归算法通过一定方式组合起来,形成一个更加强大的分类。两种方法都是把若干个分类器整合为一个分类器的方法,

2021-03-25 22:02:49 228

原创 Datawhale 零基础入门数据挖掘心跳信号分类学习反馈03

Detail 零基础入门数据挖掘 (心跳信号分类) 学习反馈TASK3使用语言:pythonTas1 – Task5Task3_数据特征工程分析主要是针对时间序列的心电图数据加上:特征time进行数据特征提取最重要的是 tsfresh 进行时间序列特征处理tsfreshextract_features( ) 函数 进行自动提取不过需要电脑内存大一点才ok;我自己的电脑就KK了...

2021-03-22 22:29:17 67

原创 Datawhale 零基础入门数据挖掘心跳信号分类学习反馈02

Detail 零基础入门数据挖掘 (心跳信号分类) 学习反馈TASK2使用语言:pythonTas1 – Task5Task2_数据探索性分析涉及函数:总览+判断数据缺失和异常+分布data.head().append(data.tail()) ——观察首尾数据data.isnull().sum() ——查看每列的存在nan情况data.shape ——观察数据集的行列信息data.describe() ——获取数据的相关统计量data.info() ——获取数据类型describe种有

2021-03-19 16:51:58 123

原创 Datawhale 零基础入门数据挖掘心跳信号分类学习反馈

Datawhale 零基础入门数据挖掘(心跳信号分类)学习反馈TASK1使用语言:pythonTas1 – Task5Task1赛题理解:根据给定的数据集,建立模型,预测不同的心跳信号(以预测心电图心跳信号类别)。数据概况:“train.csv”“testA.csv”预测指标:提交4种不同心跳信号预测的概率,与实际心跳类型结果进行对比,求预测的概率与真实值差值的绝对值。学习点:LigthGBM是boosting集合模型中的新进成员,由微软提供,它和XGBoost一样是对GBDT的高

2021-03-16 21:25:30 105

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除