自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 资源 (2)
  • 收藏
  • 关注

原创 【学习笔记】Python进行数据清洗

在b站上看到了很不错的清洗基础教程,在这里记一下自己的学习笔记。除此之外,up主的缺失值处理是直接用均值进行替代,个人觉得不是很严谨,所以替换成了随机森林算法填补缺失值。在最后做了一张思维导图作为总结。

2023-03-15 23:39:58 2931

原创 stata基本操作

part 1: 循环语句;part 2: 局部/全局变量的定义

2023-01-08 20:40:20 6675

原创 Excel | VBA基础操作

Excel VBA基础操作

2022-10-21 18:39:45 1837

原创 经济学|查找数据SOP

一些我的找经济学数据经验

2022-07-21 18:35:24 230

原创 Arcgis绘图初级教程

Arcgis基本绘图操作

2022-06-08 16:49:09 12106

原创 SPSS安装问题

问题描述提是找不到 IBM SPSS Statistics 25.msi 文件,然后找不到网络位置,所以无法安装。这个问题困扰我太久了!!然后非常偶然的,看到了IBM的官方回答,终于解决了这个问题~Extracting the Microsoft Installer (*.msi) File for IBM SPSS Statisticshttps://www.ibm.com/support/pages/extracting-microsoft-installer-msi-file-ibm-sp

2022-05-31 09:01:50 6730 5

原创 业务分析入门(四)

这一小节内容介绍了常见的9种数据分析方法和五种常见的业务场景。

2022-05-26 19:56:13 259

原创 业务分析入门(三)

业务分析入门(三)数据预处理&简单的可视化

2022-05-25 10:43:55 179

原创 笔记|业务分析入门(二)

业务分析入门(二):数据工具的选取,从业务需求、数据工具分类、根据需求选择数据工具三个方面展开。

2022-05-24 17:34:14 112

原创 业务分析入门(一)

业务分析入门:指标选取

2022-05-24 10:35:21 202

原创 R-第七章|因子分析

因子分析基础思想、因子分析步骤、以及相关R代码和结果解释。目录1. 因子分析理论基础(1)因子分析和主成分分析的区别与联系(2)因子分析模型(3)因子载荷的意义(4)因子旋转的目的(5)因子得分(6)最后画出因子信息图2. 因子分析的基本步骤(1)确认数据是否适合作因子分析(2)构造因子变量(3)按照方差贡献确定因子数(4)旋转因子使其更具有可解释性(5)计算因子得...

2022-04-10 18:15:39 1464

原创 R-第六章|主成分分析

R-多元回归分析-PCA

2022-04-06 22:26:48 4688

原创 机器学习|代价函数绘制

最近在学习Andrew NG的机器学习课程,上到定义函数的时候,就想着能否把代价函数画出来。首先在编辑器定义一个函数文件,保存到工作路径中function J = costFunctionJ(X,y,theta) m = size(X,1); %样本量 predictions = X*theta sqrErrors = (predictions-y).^2; J = 1/(2*m)*sum(sqrErrors);这是一个简单的一元函数,表达式为我的思路就是写一个循环,

2022-03-24 14:09:50 2028

原创 R|广义线性模型知识点归纳

本文分为两个部分: (1)广义线性模型的分类及其运用范围; (2)相关R代码。

2022-03-21 21:58:45 3446

原创 R语言安装包问题

问题:想要安装nnet,但是提示打不开URLinstall.packages(nnet)搜索CSDN解决了,解决方法是install.packages("nnet",repo="https://mirrors.ustc.edu.cn/CRAN/")repo后面的是镜像网站,可以在CRAN - Mirrors中找到自己所在国家的镜像网址,修改repo即可。...

2022-03-21 17:39:36 216

原创 R语言报错

> setwd("C:/...")> dat<-read.table("eg2.txt", header = T)运行这个代码的时候,出现了如下报错:Error in make.names(col.names, unique = TRUE) : '<ff><fe><79>'多字节字符串有错此外: Warning messages:1: In read.table("eg2.txt", header = T) : line 1 a...

2022-03-20 09:42:32 2047

原创 hive-table insclause -0 has 10 columns, but query has 11 columns

很好的思路是,分别desc创的表和要插入的数据表。然后我发现之前创的表没有drop掉,所以发生了这个问题。

2021-09-30 10:32:27 1381

原创 SQL|where & and

今天搞懂了on where 和 on and的区别,mark一下。SELECT *FROM table_a a LEFT JOIN table_b bon a.id = b.idwhere a.name = 'Lucy'SELECT *FROM table_a a LEFT JOIN table_b bon a.id = b.idand a.name = 'Lucy'where是指,ab表合并之后,筛选出a.name = "Lucy"的行。and则是,先用name = 'Lu

2021-08-26 23:03:43 2172

原创 Python_Import pandas:AttributeError: module ‘pandas‘ has no attribute ‘core‘解决方案

今天在jupyter执行import pandas的时候报错了,重启jupyter之后就好了。不过在重启之前猜测是版本不兼容,所以搜索了一下如何检索版本与第三方库,在这里记录一下。打开命令提示符# 获得jupyter安装路径where jupyter# 获得路径后,cd进入# 获得已经安装的第三方库pip list#获得已经落伍的第三方库pip list --outmoded...

2021-08-13 14:15:18 685

原创 python把脚本变成exe的问题

今天想要安装pyinstaller,结果失败了。报错显示“SSL module is not available”,经过搜索最后解决了问题。1、将Anaconda的安装路径(具体添加方式见这里)加入path环境设置中,具体做法见这里。2、安装完之后 Win+R / cmd/ pip install pyinstaller完美解决!...

2021-07-23 14:43:09 140 2

原创 实习生日记|0722

时隔多日,终于能够独立写代码来实现自动化了!这次比较难搞的两个需求:(1)涉及到三张表之间的勾稽关系,比如已知表1和2有A\B特征,表2和表3有共同C特征,现在要比较比较表1和表3的D特征,所以需要将表1和表2进行匹配后通过表2间接比较1和3;(2)涉及到同一个单号下金额的匹配问题,问题是,在有多条金额数据的单号下,有可能是部分金额之和对应另一张表的金额,也可能是单行金额的一一对应,不过现在这个问题我也没有解决好。过程中有四点收获。第一,代码需要反复修改。具体为在jupyter中新建一个代码块,将有

2021-07-22 18:02:59 66

原创 实习生日记0712

1、去掉nan和NaT输出的部份表格如图:nan是np模块的数据空缺;NaT是pd模块的数据空缺,是时间缺失值。想要在数据缺失部分显示空白,但是 fillna('')没有用,后来找到了如下代码:import numpy as np# 遍历列,去掉nanfor i in df.columns: df[i] = dnp.where(df[i] == 'nan', np.nan, df[i]) #强制转换df.fillna('')# 去掉NaT## 如果日期列是str,先转换成.

2021-07-12 14:34:14 73

原创 办公自动化|第一周

记录一下实习过程中第一周碰到的一些小问题。1. 报错“No engine for filetype”网上说是pd.to_excel()的问题,应该改成pd.to_csv,但我试了还是不行。后来发现是我输出文档的路径path_out = 'test' 没加文件后缀。2. 运行报错 "No such file or dictionary"非常神奇,我也不知道啥原因,路径什么的都没问题。后来重开了spyder,把Shift+Enter快捷键换成点击开始,看见它 cell(...)...变成 run

2021-07-09 21:15:24 2232

原创 [210701] Data type & Missing Data

5 DataType & Missing Data5.1 DataType(1)查看数据类型df.被引数.dtype(2)更改数据类型df.被引数.astype('float64')5.2 Missing Data(1)isnull()的用法df[pd.isnull(df.Route)] #展示Route显示NaN的数据pd.isnull(df.Route).sum() #Route显示NaN的个数(2)填补空白值df.Route.fillna('Unknown'

2021-07-01 11:21:46 108

原创 kaggle入门教程笔记| 3

前言:summary Functions and Maps,还有一些题目记载1.summary Functions这次用到的是作业的数据,记数据集为data(1) 描述性统计data.realgdp.describe()(2) 均值gdp_mean = data.realgdp.mean() #求realgdp的均值(3) 求出对象数量和详情比如在整理文献数据的时候,有些作者写了不止一篇,现在要得到文档中有多少个作者。#法一name_list = set(list(df['作者']

2021-06-28 23:40:17 129

原创 kggale入门教程笔记|1&2

前言:初学python,在这里做一下笔记,方便自己复习回看。以下示例源自kaggle的新手教程。在之前先输入几行代码让引入的np和pd可以多次使用from IPython.core.interactiveshell import InteractiveShell InteractiveShell.ast_node_interactivity = "all" import numpy as npimport pandas as pd pd.options.display.max_rows = 8

2021-06-28 20:34:23 105

CH10 重复博弈课后题解析

【关键词】博弈论课后题解析 【内容】 chapter10 重复博弈的11道课后题(10.4和10.12(b)小问不会写,介意的话不要买) 【适用教材】 《博弈论导论》史蒂文·泰迪里斯 (Game Theory: An Introduction)by Steven Tadies 【备注】 1. pdf一共18页,纯手写,如果有字看不清可以问,售后包括2次内容答疑。 2. 不能保证100%的正确率,介意慎买。 3. 后面的课后题没有放原题(我太懒了),需要自己对照书本查看。

2022-07-13

博弈论导论|第九章多阶段博弈|课后题解析

【适用教材】 《博弈论导论》史蒂文·泰迪里斯 (Game Theory: An Introduction)by Steven Tadies 【内容】 chapter9 多阶段博弈的教材知识点&6道课后题 【备注】 1. pdf一共14页,纯手写,如果有字看不清可以问,售后包括1次内容答疑。 2. 不能保证100%的正确率,介意慎买。 3. 有意向购买可以找我看两页预览(不能指定)。 4. 后面的课后题没有放原题(我太懒了),需要自己对照书本查看。

2022-07-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除