自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 收藏
  • 关注

原创 pymysql.err.IntegrityError: (1062, “Duplicate entry ‘******’)

主键组合有重复数据

2022-07-11 11:27:50 1367 1

原创 DataFrame——将某列符合条件的值转换成别的值

DataFrame,列的值的转换

2022-07-06 16:03:38 2156 1

原创 AttributeError: ‘NaTType‘ object has no attribute ‘translate‘

关于translate的报错

2022-07-05 14:16:03 822

原创 ValueError: Grouper for ‘day‘ not 1-dimensional

报错:ValueError: Grouper for ‘day’ not 1-dimensional错误代码pivoted_counts=df.pivot_table(index='uid',columns='day',values='day',aggfunc='count').fillna(0)columns_month=df.month.sort_values().astype('str').unique()pivoted_counts.columns=columns_monthpivote

2022-05-12 16:37:00 1713

原创 Tensorflow学习笔记

1.Tensorflow是Google推出的机器学习开源框架,对Python有语言支持,拥有了多种模型和算法。Tensorflow广泛应用于文本处理,语音识别和图像识别等多项机器学习和深度学习领域。2.将Tensorflow理解为一张计算图中“张量的流动”,其中,Tensor(张量)代表了计算图中的边,Flow(流动)代表了计算图中节点所做的操作而形成的数据流动。

2022-03-03 12:58:20 495

原创 pip 更新报错——You should consider upgrading via the ‘python.exe -m pip install --upgrade pip‘ command.

1.pip更新之前都是:python -m pip install --upgrade pip2.但今天一直提示有错误,试过输入:python -m pip install --upgrade pip -i https://pypi.douban.com/simple3.也试过删除形如pip-21.0.3.dist-info的文件夹,再输入python -m pip install --upgrade pip也是报错

2022-02-21 14:42:24 35026 2

原创 将Excel里多个工作表拆分成单独的Excel

1.右键任意工作表—“查看代码”2.窗口输入代码Private Sub 分拆工作表() Dim sht As Worksheet Dim MyBook As Workbook Set MyBook = ActiveWorkbook For Each sht In MyBook.Sheets sht.Copy ActiveWorkbook.SaveAs Filename:=MyBook.Path & "\" & sht.Nam

2021-05-11 16:54:41 2192

原创 LookupError:Resource punkt not found.

运行以下代码:import nltknltk.download('punkt')就OK了

2021-04-06 16:43:11 165

原创 小陈Python学习笔记——小白笔记

一、.map()函数语法:map(function, iterable, ...)参数:function – 函数iterable – 一个或多个序列返回值:Python 2.x 返回列表。Python 3.x 返回迭代器。实例:>>>def square(x) : # 计算平方数... return x ** 2... >>> map(square, [1,2,3,4,5]) # 计算列表各个元素的平方[1,

2020-12-25 20:43:20 154

原创 StataIC——短面板数据分析(以检验啤酒税将降低交通死亡率的假说为例)

一、面板数据与模型1.面板数据分类(1)短面板(N>T)和长面板(N<T)(2)动态面板(解释变量包含被解释变量的滞后值)和静态面板(3)平衡面板(每个个体在相同的时间内都有观测值)和非平衡面板2.面板数据模型(1)非观测效应模型(存在不可观测的个体效应模型)固体效应模型(fixed effects model,fe)随机效应模型 (random effects model,re)选择fe还是re,用hausman检验。Help hausman查看用法,例如

2020-11-20 20:19:49 21067 19

原创 Kaggle——泰坦尼克号(Titanic: Machine Learning from Disaster)详细过程

一、简介1.数据(1)训练集(train.csv)(2)测试集(test.csv)(3)提交文件示例(gender_submission.csv)对于训练集,我们为每位乘客提供结果。模型将基于乘客的性别和阶级等“特征”也可以使用特征工程来创建新特征。我们要做的就是对于测试集中的每个乘客,使用训练的模型来预测他们是否在泰坦尼克号沉没中幸存下来。2.属性说明属性说明PassengerId乘客IDSurvived是否获救,1为是,0为否Pclass乘客票务舱,1

2020-11-20 15:06:49 2874 2

原创 sofasofa——形状识别2:方圆之外

一、简介1.背景介绍我们给出六千张图像作为训练集。每个图像中只有一个图形,要么是圆形,要么是正方形。任务是根据这六千张图片训练出一个二元分类模型,并用它在测试集上判断每个图像中的形状是圆还是方;测试集中有些图像既不是圆、也不是方,也请将它们甄别出来。(比赛链接)2.数据数据文件:train.csv 训练集,文件大小 34.7mbtest.csv 预测集, 文件大小 30.0mbsample_submit.csv 提交示例 文件大小 40kb数据说明:训练集中共有6000个灰度图像,预测集

2020-09-01 17:24:33 535 2

原创 sofasofa——足球运动员身价估计

一、简介1.背景介绍每个足球运动员在转会市场都有各自的价码。本次数据练习的目的是根据球员的各项信息和能力值来预测该球员的市场价值。2.数据数据文件train.csv 训练集,文件大小 2.20mbtest.csv 预测集, 文件大小 1.44kbsample_submit.csv 提交示例 文件大小 62kb数据来源FIFA2018。为了公平起见,数据已经进行脱敏加工处理。数据说明训练集中共有10441条样本,预测集中有7000条样本。每条样本代表一位球员,数据中每个球员有63项属性

2020-08-15 00:49:51 2610 3

原创 Python——科学计算包NumPy的简易使用方法/指南/教程

一、前言博主是一个普普通通的大学生,没有很厉害的技术,写的内容都是不太正经的偏小白简单的,写的也是学校教过的知识消化后自己的见解,不是很学术研究的博文。配置:Window 7旗舰版+64位操作系统+Anaconda3 Spyder(64-bit)大数据挖掘经常用的包有:NumPy(科学计算库),SciPy(科学计算库),Pandas(数据分析处理库),Matplotlib(数据可视化库),Scikit-learn(机器学习库)。这篇博文主要是介绍NumPy。NumPy是一个开源的Python科学计

2020-08-12 15:14:26 319

原创 sofasofa——交通事故理赔审核

一、简介1.背景介绍在交通摩擦(事故)发生后,理赔员会前往现场勘察、采集信息,这些信息往往影响着车主是否能够得到保险公司的理赔。训练集数据包括理赔人员在现场对该事故方采集的36条信息,信息已经被编码,以及该事故方最终是否获得理赔。我们的任务是根据这36条信息预测该事故方没有被理赔的概率。2.数据数据文件train.csv 训练集,文件大小 15.6mbtest.csv 预测集, 文件大小 6.1mbsample_submit.csv 提交示例 文件大小 1.4mb训练集中共有200000条

2020-07-30 01:05:37 2606 3

原创 Python实验——用sklearn模块中的决策树方法对德国信贷数据进行分类。

一、简介博主是一个普普通通的大学生,没有很厉害的技术,写的内容都是不太正经的偏小白简单的,写的也是学校教过的知识消化后自己的见解,不是很学术研究的博文。本篇博文主要是关于Python扩展模块pandas中数据结构Series的创建及数据的访问,DataFrame的创建及数据的访问和关于Python的机器学习模块sklearn中决策树的构建。配置:Window 7旗舰版+64位操作系统+Anaconda3 Spyder(64-bit)这篇博文是博主的实验报告,之所以以图片形式上传就是避免抄袭。如果有

2020-07-11 17:59:41 2022 1

原创 Python实验——利用一元线性回归建立TV广告费用与销售额之间的回归方程

一、简介博主是一个普普通通的大学生,没有很厉害的技术,写的内容都是不太正经的偏小白简单的,写的也是学校教过的知识消化后自己的见解,不是很学术研究的博文。用Python外部扩展模块NumPy中数组的操作,并用NumPy、sklearn模块进行一元线性回归分析。配置:Window 7旗舰版+64位操作系统+Anaconda3 Spyder(64-bit)这篇博文是博主的实验报告,之所以以图片形式上传就是避免抄袭。如果有博主的师弟师妹找到这篇博文,博主想和你说这份实验报告很简单,好好看看老师给的PPT,

2020-07-11 17:45:02 1692

原创 Stata实验——计算个股“上海机场“的市场模型和CAPM模型的β值

一、简介这是基于我上一篇的博文《StataIC——线性回归计算个股的β值》传送门的例子总结。博主是一个普普通通的大学生,没有很厉害的技术,写的内容都是不太正经的偏小白简单的,写的也是学校教过的知识消化后自己的见解,不是很学术研究的博文。配置:Window 7旗舰版+64位操作系统+StataIC 14(64-bit)这篇博文是博主的期末作业,之所以以图片形式上传就是避免抄袭。如果有博主的师弟师妹找到这篇博文,博主想和你说这份实验报告很简单,你只需要把实验课视频好好看一遍,根据老师的教导下载好数据跟

2020-07-11 15:52:25 6896 2

原创 StataIC——线性回归计算个股的β值

一、简介这是一篇关于线性回归的基本操作,用月度收益率数据以及其所在市场的市场收益率数据,通过StataIC软件求得个股的β系数博主是一个普普通通的大学生,没有很厉害的技术,写的内容都是不太正经的偏小白简单的,写的也是学校教过的知识消化后自己的见解,不是很学术研究的博文。配置:Window 7旗舰版+64位操作系统+StataIC 14(64-bit)二、参数解释1. β值的含义 β值衡量系统性风险β=1,表示该单项资产的风险收益率与市场组合平均风险收益率呈同比例变化;β>1,

2020-07-11 15:18:25 13633 7

原创 Stata实验——关于我国GDP增长率和CONS增长率

一、简介这是基于我上两篇的博文《StataIC——数据描述性统计分析、平稳性检验、平稳化》和《StataIC——协整检验与误差修正模型》的例子总结。博主是一个普普通通的大学生,没有很厉害的技术,写的内容都是不太正经的偏小白简单的,写的也是学校教过的知识消化后自己的见解,不是很学术研究的博文。配置:Window 7旗舰版+64位操作系统+StataIC 14(64-bit)这篇博文是博主的期末作业,之所以以图片形式上传就是避免抄袭。如果有博主的师弟师妹找到这篇博文,博主想和你说这份实验报告很简单,你

2020-07-11 01:16:34 8917 5

原创 StataIC——协整检验与误差修正模型

一、简介这篇博文是在博主写的上一篇《StataIC——数据描述性统计分析、平稳性检验、平稳化》的基础上的建立的,这篇博文主要是做协整检验和误差修正模型。本篇博文是一篇关于线性回归的基本操作;时间序列的平稳性检验、协整检验和误差修正模型(在下一篇博文里延续)等的博文。博主是一个普普通通的大学生,没有很厉害的技术,写的内容都是不太正经的偏小白简单的,写的也是学校教过的知识消化后自己的见解,不是很学术研究的博文。配置:Window 7旗舰版+64位操作系统+StataIC 14(64-bit)二、协

2020-07-10 21:43:12 36968 10

原创 StataIC——数据描述性统计分析、平稳性检验、平稳化

一、简介1.本篇博文是一篇关于线性回归的基本操作;时间序列的平稳性检验、协整检验和误差修正模型等的博文。2.博主是一个普普通通的大学生,没有很厉害的技术,写的内容都是不太正经的偏小白简单的,写的也是学校教过的知识消化后自己的见解,不是很学术研究的博文。3.配置:Window 7旗舰版+64位操作系统+StataIC 14(64-bit)二、数据描述性统计分析1.导入数据(1)打开StataIC软件,在软件的上栏目中找到下图圈出的图标,那个图标就是导入数据的入口(2)点进去之后,StataIC

2020-07-10 18:28:54 49531 12

原创 sofasofa—公共自行车使用量预测—参数调整、优化结果

一、简介1.背景介绍公共自行车低碳、环保、健康,并且解决了交通中“最后一公里”的痛点,在全国各个城市越来越受欢迎。本练习赛的数据取自于两个城市某街道上的几处公共自行车停车桩。我们希望根据时间、天气等信息,预测出该街区在一小时内的被借取的公共自行车的数量。2.数据数据文件:train.csv 训练集,文件大小 273kbtest.csv 预测集, 文件大小 179kbsample_submit.csv 提交示例 文件大小 97kb训练集中共有10000条样本,预测集中有7000条样本。数据

2020-06-11 11:41:49 1747 1

原创 关于Tampermonkey(油猴)的安装和使用的小白教程

一、Tampermonkey的介绍Tampermonkey是一个神奇的网络插件,真的是新时代的黑科技,学生党的福音

2020-04-28 16:39:09 221401 18

原创 关于FM算法

一、FM算法的简介:⑴FM 算法可进行回归和二分类预测的一种算法。⑵FM的主要目标就是解决在数据稀疏的情况下,特征怎样组合的问题。⑶FM的特点是考虑了特征之间的相互作用,是一种非线性模型。⑷目前FM算法是推荐领域被验证的效果较好的推荐方案之一,在诸多电商、广告、直播厂商的推荐领域有广泛应用。⑸原作者在提出FM的时候,曾以SVM、MF为相比较的例子。①SVM是可以适用多场合的,但有个场合...

2020-04-19 03:32:00 1628

原创 周志华《机器学习》--第四章决策树--笔记

2020-02-05 07:35:22 170

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除