- 博客(23)
- 资源 (171)
- 问答 (12)
- 收藏
- 关注
原创 R语言神经网络
library(nnet)Warning message:"package 'nnet' was built under R version 3.5.3"x1 <- round(runif(2000,1,2000))x2 <- round(runif(2000,1,2000))x11 <- scale(x1[1:1900])x12 <- scale(...
2019-07-31 18:39:56 1380
原创 R 语言聚类关联规则
a <- c(10,9,8)b<- c(4,3,2)c<- c(8,9,10)a 10 9 8# 余角相似度sum(a*b)/sqrt(sum(a^2)*sum(b^2))0.984682118265774sum(a*c)/sqrt(sum(a^2)*sum(c^2))0.983673469387755x<- rbind(a,b,...
2019-07-31 18:29:43 1330
原创 R语言的决策树
# 计算商a <- rep(0.5,2) #0.5重复两遍-sum(a*log2(a))1b <- rep(0.25,4)-sum(b*log2(b))2c <- rep(0.125,8)-sum(c*log2(c))3# r语言实现决策树library(rpart)iris.rp = rpart(data=iris,Species~.,...
2019-07-31 12:57:52 1637
原创 R语言实现描述性统计
# 01分布a<- runif(20)a 0.0534173720516264 0.0381318787112832 0.253885793266818 0.851638266118243 0.356620342005044 0.175922254333273 0.270358079113066 0.421792675741017 0.675487545551732...
2019-07-31 11:59:31 4327
原创 贪心科技机器学习训练营(十一)
先把来源写上来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities往期文章:K-means算法k - means 是无监督学习的一种,主要用于分类首先确定K值,就是类别数,我们想把数据分为几类。根据k值随机选取K个点,作为中心点,分别计算其余各个点到这K个点的距离。对于每一个非中心点,找到离它最近的那个中心点,...
2019-07-19 15:41:40 1423
原创 贪心科技机器学习训练营(十)
先把来源写上来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities使用决策树预测糖尿病 分类任务数据源: https://www.kaggle.com/uciml/pima-indians-diabetes-database#diabetes.csv注意: 需要使用如下命令安装额外两个包用于画图conda ins...
2019-07-19 00:37:50 1314
原创 贪心科技机器学习训练营(九)
先把来源写上来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities过去决策树文章决策树和随机森林(上)决策树和随机森林(下)决策树如何可视化随机森林算法随机森林准确率和分类器关系使用决策树和随机森林预测员工离职率我们的任务是帮助人事部门理解员工为何离职, 预测一个员工离职的可能性.数据来源...
2019-07-19 00:21:56 1445
原创 二元随机变量分布
对于概率统计最重要的二元随机变量分布,本人的遗忘率比较大,所以有空整理下二元随机变量分布,用来不时查阅伯努利分布伯努利分布亦称“零一分布”、“两点分布”。称随机变量X有伯努利分布, 参数为p(0<p<1),如果它分别以概率p和1-p取1和0为值。EX= p,DX=p(1-p)。如果随机变量X只取0和1两个值,并且相应的概率为:随机变量X服从参数为p的伯努利分布,若令q=1一...
2019-07-14 23:18:37 2597
原创 r语言的逻辑回归分类
iris 是r语言内置的数据集head(iris) # 与python的不同iris.head()Sepal.LengthSepal.WidthPetal.LengthPetal.WidthSpecies 5.1 3.5 1.4 0.2 setosa 4.9 3.0 1.4 0.2 setosa 4.7 3.2 1.3 0.2 se...
2019-07-14 17:53:45 2272
原创 三十二、R语言基本语法(下篇)
https://www.w3cschool.cn/r/连接字符串 - paste()函数…表示要组合的任意数量的自变量。sep表示参数之间的任何分隔符。它是可选的。collapse用于消除两个字符串之间的空格。 但不是一个字符串的两个字内的空间。a <- "Hello"b <- 'How'c <- "are you? "print(paste(a...
2019-07-14 16:19:16 1263
原创 了解SQL
什么SQLSQL是一门和数据库打交道的语言SQL(结构化查询语言)是用于访问和操作数据库中的数据的标准数据库编程语言。 SQL是关系数据库系统的标准语言。所有关系数据库管理系统(RDMS),如MySQL、MS Access、Oracle、Sybase、Informix、Postgres和SQL Server都使用SQL作为它们的标准数据库语言。 数据库管理系统(dbms)数据库管理系统...
2019-07-14 15:36:27 1153
原创 人不能没有梦想
人不能没有梦想什么是梦想曾经,我们也有儿时的理想;岁月蹉跎,我们也曾有豆蔻年华的追求;而今,我们依然少不了自己的坚持和努力。人生的意义,在于通过不断的努力和修炼,去实现自己的理想。虽然路途艰辛,但是通过我们一步步的努力,才能领略生命的精彩,创造自己的传奇!梦想是对未来的一种期望,在现在想未来的事,不切实际的梦想则是执念。梦想就是一种让你感到坚持就是幸福的东西,人生的目标,甚至其可以视为一...
2019-07-14 12:33:15 1146
原创 贪心科技机器学习训练营(八)
先把来源写上来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities这次是贝叶斯先回忆下是啥东西贝叶斯分类算法贝叶斯分类流程贝叶斯算法对文本进行分类实例SVM实现人脸识别深入理解SVMsvm的三个核函数SVM支持向量机(上)SVM支持向量机(下)回忆下了tfidf垃圾邮件分类之前做过文本分类...
2019-07-13 19:08:07 3448 14
原创 贪心科技机器学习训练营(七)
先把来源写上来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities以前文章:贝叶斯分类算法贝叶斯分类流程贝叶斯算法对文本进行分类实例SVM实现人脸识别深入理解SVMsvm的三个核函数SVM支持向量机(上)SVM支持向量机(下)%matplotlib inlineimport numpy as np...
2019-07-13 17:23:45 1565 2
原创 贪心科技机器学习训练营(五)
先把来源写上来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities以前文章机器学习中的逻辑回归【机器学习】银行贷款违约预测还有好多好文,欢迎关注我逻辑回归预测银行客户是否会开设定期存款账户逻辑回归要求预测值为 0 或者 1, 自变量特征值应该彼此独立。该数据集来自UCI机器学习库(http://archiv...
2019-07-13 11:08:06 1655
原创 贪心科技机器学习训练营(六)
先把来源写上来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities对于这个Titanic泰坦尼克号生存绝对有笔记Seaborn数据可视化通过Logistic Regression预测Titanic乘客是否能在事故中生还导入工具库和数据查看缺失数据2.1. 年龄2.2. 仓位2.3. 登船地点2.4. ...
2019-07-12 23:59:58 1597
原创 贪心科技机器学习训练营(四)
这次回归之前写过关于平安股票的,竟然没想到是同一个案例平安股票分析import numpy as np # 数学计算import pandas as pd # 数据处理, 读取 CSV 文件 (e.g. pd.read_csv)import matplotlib.pyplot as pltfrom datetime import datetime as dt# 你可以使用如下的方...
2019-07-12 22:25:08 1548
原创 贪心科技机器学习训练营(三)
先把来源写上来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activitiesknn回归作业二手车估计案例import pandas as pdimport matplotlibimport matplotlib.pyplot as pltimport numpy as npimport seaborn as sns...
2019-07-12 18:34:00 1931 1
原创 贪心科技机器学习训练营(二)
来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities写文章交作业这次训练营的讲的是knn我先找下文章回忆下KNN算法KNN实现“手写识别”GridSearchCV和交叉熵机器学习的回归算法sklearn模型的训练(上)近邻算法分类[机器学习认识聚类(KMeans算法)]这些都是我写的吗???怎么没啥...
2019-07-12 17:45:07 2065
原创 21 | 装饰器
在 Python 中,装饰器是一种函数或类,它可以接受一个函数作为输入,并返回一个新的函数作为输出。新的函数通常会扩展或修改原始函数的行为。装饰器的语法通常使用 @ 符号和函数名来定义。在上面的代码中,我们使用 @ 符号和 my_decorator 函数来装饰 my_function 函数。
2019-07-11 22:35:28 1340
原创 十九、Seaborn数据可视化
Seaborn是基于matplotlib的图形可视化python包。它提供了一种高度交互式界面,便于用户能够做出各种有吸引力的统计图表。# 条形图import seaborn as snsimport matplotlib.pyplot as plt%matplotlib inline# 加载数据集泰坦尼克号titanic=sns.load_dataset('titanic')ti...
2019-07-07 22:34:03 1366
原创 71 | Python 网络爬虫案例 —— 爬取百度图片
robots.txt文件是一个文本文件,使用任何一个常见的文本编辑器,比如Windows系统自带的Notepad,就可以创建和编辑它。有形式的事物,我们看到的,是图画、照片、拓片等的统称。在一个json 的有30张图片,所以发起一个json的请求,我们可以爬去30张图片,但是还是不够。图片是通过ajax 方法来加载的,也就是当我下拉,图片会自动加载,是因为网站自动发起了请求,从图中可以看出,百度的图片是完全可以下载,说明了图片可以爬取。图片是在云服务器的数据库中的保存起来的。首先,明白图片是什么?
2019-07-03 10:18:41 3186
019 - backtrader回测布林带突破策略
2024-08-11
018 - backtrader回测反转策略
2024-08-11
017 - backtrader回测趋势跟随策略
2024-08-11
016 - backtrader回测波动率策略
2024-08-11
015 - backtrader回测动量策略
2024-08-11
014 - backtrader回测均值回归策略
2024-08-11
013 - backtrader回测沪深300指数简单移动平均线交叉策略
2024-08-11
012 - akshare分析NYBOT棉花历史数据
2024-08-11
011 - efinance分析豆一主连期货
2024-08-11
010 - 东方财富帖子标题情绪分析
2024-08-10
009 - 上证50ETF基金数据分析及预测
2024-08-10
008 - 基于RNN和LSTM的贵州茅台股票开盘价预测
2024-08-10
本项目旨在通过对智联招聘网站上发布的数据分析岗位信息的分析和可视化,帮助应届毕业生和希望进入数据分析行业的专业人士更好地理解当前
2024-07-23
70 - 双十一美妆数据分析可视化
2024-07-23
71 - 去哪儿旅游数据分析
2024-07-23
本报告所选数据集下载自kaggle 数据集包含美国 2,392 名高中生的全面信息,详细介绍了他们的人口信息、学习习惯、父母参与
2024-07-21
68 - 深圳链家二手房房源数据分析
2024-07-21
基于YOLO5细胞检测实战.zip
2024-02-19
天池-新闻推荐 推荐系统
2024-02-19
27 - Titanic 乘客生存决策树预测
2024-02-19
SVM对文档进行分类:
2024-02-19
16 - Pytorch构建Logistic二分类模型
2024-02-03
13 - 使用代理ip爬取安居客房源信息
2024-01-14
手动爬取天天基金网基民评论与东方财富网股市行情的资讯,从基民评论、重仓股票、市场行情三个方面LDA模型进行分析
2023-11-03
03.04 Requests豆瓣.ipynb
2023-11-01
SpringBoot+Mybatius图书管理系统 语言:Java 开发工具:IntelliJIDEA-2019.3 JDK版
2023-10-30
通用的Java工具类,主要包括基础工具类(时间、正则表达式、字符串、随机数等等),excel解析生成、word解析生成、文件操作
2023-10-22
基于Java的学生管理系统,旨在提供学生信息的管理和查询功能
2023-10-22
基于Python编程的RFM细分聚类案例
2023-08-21
65 - python增长模型案例
2023-08-21
A/B测试 展示如何运用Python进行数据分析、可视化和统计显著性检验
2023-08-21
63 - 留存分析在现代商业中的关键作用 python 案例
2023-08-21
62 - Python 漏斗分析案例
2023-08-20
61 - 归因渠道分析案例 python
2023-08-20
gitcode 可以搭建gitpage
2022-08-25
启动CDH,报错ERROR StatusLogger No log4j2 configuration file found. Using default configuration...ogging.
2020-03-16
cloudera-manager-agent.x86_安装报错
2020-03-15
Sqoop导入数据到Hbase报错
2020-03-01
Centos7运行Elasticsearch6.5.4报错
2020-01-13
Centos7运行elasticsearch-6.5.4报错
2020-01-09
为什么在腾讯云服务器测试uwgis老是失败
2019-11-17
为什么在腾讯云服务器测试uwgis老是失败
2019-11-17
npm安装全局怎么使用加速?
2019-04-23
npm安装全局怎么使用淘宝源加速?
2019-04-22
npm这种情况,nodejs是不是安装好了
2019-04-18
TA创建的收藏夹 TA关注的收藏夹
TA关注的人