- 博客(54)
- 收藏
- 关注
原创 Hive,FineBI-30W聊天数据分析及可视化-B站黑马学习记录
Hive,FineBI-30W聊天数据分析及可视化-B站黑马学习记录2023B站黑马Hadoop、Hive、云平台实战项目
2023-07-16 15:35:25 810
原创 爬虫python学习代码记录3-抓取某电商网站的商品数据
Python3爬虫、数据清洗与可视化实战 学习记录第4章 大型爬虫案例:抓取某电商网站的商品数据
2022-10-07 15:59:32 1390
原创 爬虫python学习代码记录2-用API爬取天气预报数据
Python3 爬虫、数据清洗与可视化实战用API爬取天气预报数据,并将数据存入MongoDB中
2022-10-06 10:39:36 1185
原创 R语言上课代码记录9
# Linear Regressionlibrary("ggplot2")data("mtcars")# plot of dataggplot(data = mtcars) + geom_point(aes(x=wt, y=mpg)) + theme_bw()# linear model mpg = a*wt + b + error# let a = -5, b = 40, then my model becomes mpg = -5*wt + 40 + errorggplot(.
2022-05-30 10:22:30 504
原创 R语言代码记录8
setwd("C:/Users/烟雨潇潇/Desktop/大学作业/R语言数据分析")mydata <- read.csv('all_stocks_5yr.csv')mydata1 <- mydata[c('Name','date','close')]colnames(mydata1)[c(2,3)] <- c('Date','Price')AAPL <- mydata1[which(mydata1$Name=='AAPL'),]AAPL <- AAPL[which.
2022-05-20 17:01:43 319
原创 R语言代码记录7
# Review SessionCountry <- c('US', 'UK', 'CA', 'CN', 'KR')Year <- seq(2010,2019,by=1)length(Country)GDP <- runif(length(Country)*length(Year), min=0, max=10)# rep(Country, each=length(Year))# rep(Country, length(Year))A <- rep(Country, .
2022-05-06 16:49:29 165
原创 R语言上课代码记录6
# Data visualization# Time series# install ggplot2library('ggplot2')attach(economics)mydata <- economicsggplot(data = mydata, mapping = aes(x=date, y=psavert)) + geom_line() + labs(title = 'Personal saving rate', x = 'Year', .
2022-04-22 18:38:59 288
原创 R语言上课代码记录5
# loop# For loop# for (variable in sequence){statement} # example 1for(i in c(1:10)) { print(i)}# example 2A <- lettersfor (i in c(1:10)){ cat(A[i],'\n')}# example 3n <- 10for (i in c(n:1)){ cat(rep('*',i), '\n')}# example 4n.
2022-04-21 10:49:37 345
原创 时间序列 灰色预测 matlab代码记录
%% 时间序列clc,clear y=xlsread('近3年数据.xlsx','高等学校学生男女比例','B2:D2'); n=length(y); alpha=0.8;yt=(y(1)+y(2))/2; for i=2:n yt(i)=alpha*y(i-1)+(1-alpha).*yt(i-1); end err=sqrt(mean((y-yt).^2)); %计算误差test= 4 ;%再往后预测几年for i=n+1:n+test .
2022-04-13 10:53:43 423 1
原创 python秩和比综合评价代码记录
import pandas as pdimport numpy as npfrom collections import Counterimport statsmodels.api as smimport scipy.statsdef rsr(data, weight=None, threshold=None, full_rank=False): Result = pd.DataFrame() n, m = data.shape # 对数据编秩 if full_.
2022-04-13 10:52:41 2019 1
原创 R语言上课代码记录4
# A powerful tool in data mining: which()A <- c(10:20)# the which() gives you the position of elements of a # logical vector that Truewhich(A>15)# select the elements in A that are > 15A[which(A >15)]# which.maxwhich.max(A) # the pos.
2022-04-08 17:08:56 530
原创 R语言上课代码记录3
# import data# import csv filedata1 <- read.csv("C:/Users/烟雨潇潇/Desktop/大学作业/R语言数据分析/data/co2.csv")# path <- scan("clipboard", what="string")#read.csv(path)# 效果 "C:\\Users\\烟雨潇潇\\Desktop\\大学作业\\R语言数据分析\\data\\co2.csv"# CSDN搜到# import Stata da.
2022-04-08 15:23:38 285
原创 R语言上课代码记录2
# vectora <- seq(1,10,2) # rep# random numbersb <- runif(100,min=0,max=1) # uniform distributionc <- rnorm(100,0,2) # normal distribution N(0,4)# listd <- list(a,b,c)# dataframemydata <- data.frame(b,c)# matrixA <- matrix(c.
2022-03-26 09:01:35 175
原创 R语言通识课代码记录(1)
# Data structure# vectorID <- c(1:50)print(ID)# seq() functionscore1 <- seq(from=-10, to=10, by=2)score2 <-seq(-10,10, length.out=10)# rep() functionscore3 <- rep("A",50)?repscore4 <- rep(c("A","B","C"), times=10)score5 <- re.
2022-03-18 16:52:46 186
原创 DTM 相似度计算(matlab)代码记录
DTM算法,一种衡量两个长度不同的时间序列的相似度的方法。clc,cleara=[8 9 1]'; % 输入两个列向量b=[2 5 4 6]';[rowa,la]=size(a); [rowb,lb]=size(b);% 计算对应点的欧式距离d,a为列,b为行for i=1:rowa for j=1:rowb d(i,j)=abs(a(i)-b(j)); endend% 计算从左上到右下的累加距离DD(1,1)=d(1,1);for i=2:row.
2022-03-12 16:32:06 850
原创 2021年美赛F题
缺失值处理:比如某国家一直以来,或者近20年都没有该指标(如每百万人中研究人员数量),认为该数据空值,暂记为0,代表该国没有研究人员(这一指标表现差)来源某博客(2)分段三次埃尔米特插值编程实现(建模比赛中最常用)直接使用Hermite插值得到的多项式次数较高,也存在着龙格现象,因此在实际应用中,往往使用分段三次 Hermite 插值多项式 (PCHIP)。Matlab有内置的函数(实现过程已经帮我们封装好了,会调用就行了):p = pchip(x,y, new_x)x是已知
2022-02-09 12:40:03 2293
空空如也
dbeaver连接hive超时
2023-05-13
学习python queue中遇到问题
2023-02-27
TA创建的收藏夹 TA关注的收藏夹
TA关注的人