自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 Wine QQ Wechat

https://gitee.com/wszqkzqk/deepin-wine-containers-for-ubuntu@TOCWine QQ最新的开源Deb安装包阿里云的已经没了所以在这保存一下欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功

2022-03-18 20:09:52 227 2

原创 KAFKA 知乎

KAFKA moduleimport csvfrom kafka import KafkaProducerimport timedef main(): ##生产模块 producer = KafkaProducer(bootstrap_servers=['121.196.222.214:9092']) with open('D:/QQfile/answer_results.csv','r',encoding='utf8')as fp: reader=csv.

2022-01-12 16:13:00 749

原创 结巴分词 知乎

Scrapy Pipelinefrom itemadapter import ItemAdapterimport pymongofrom spider.settings import MONGODB_PORTfrom spider.settings import MONGODB_HOSTfrom spider.settings import MONGODB_DBNAMEfrom spider.settings import MONGODB_Q_SHEET_NAMEfrom spider.set

2022-01-12 16:08:46 559

原创 爬虫 爬取知乎数据

更新数据import jsonimport scrapyimport timeimport pymongofrom lxml import etreefrom spider.items import AnswerItemfrom spider.settings import MONGODB_PORTfrom spider.settings import MONGODB_HOSTfrom spider.settings import MONGODB_DBNAMEfrom spider.

2022-01-12 16:05:46 2074 1

原创 信用卡分级Spark,hadoop

import warningsimport matplotlib.pyplot as pltimport numpy as npimport pandas as pdimport seaborn as snsplt.rcParams['font.sans-serif']=['SimHei']plt.rcParams['axes.unicode_minus']=Falsewarnings.filterwarnings("ignore")pd.set_option('display.max_

2022-01-10 17:25:26 934

原创 构建信用分级卡 分箱法

信用分级卡分箱

2022-01-10 16:39:26 560

原创 阿里云服务器Ubuntu20.04图形化界面的方法(VNC登录始终密码错误解决办法)

阿里云服务器ubuntu18.04是有很大问题的,不管怎么尝试了很多种办法,似乎安装好的图形界面都是登陆不了的,即使登陆进去也是文件缺失。

2021-12-16 02:29:23 4004 2

原创 Xshell往服务器上传文件(Ubuntu)

Xshell建立链接,然后先安装上传模块sudo apt-get install lrzsz然后使用rz该命令即可从本地文件夹中选择文件上传了如果发现文件传输无动静,说明可能文件过大,此时可以尝试下列命令rz -be即可完成文件传输...

2021-12-16 01:37:58 1346

原创 多元线性回归预测国家幸福指数

多元线性回归之前复现了单特征预测幸福指数的线性回归模型,现在使用多向量特征回归看看是否会减小误差导库与查看数据import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport plotlyimport plotly.graph_objs as goplotly.offline.init_notebook_mode()from homemade.linear_regression import Li

2021-09-02 01:33:36 1006 1

原创 单变量线性回归预测幸福度

单变量线性回归来通过GDP预测国家的幸福度环境是jupyter notebook,python3.7导库import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom homemade.linear_regression import LinearRegression导入数据,并输出看一下数据状态,有时还需要看看有没有缺失值异常值,做一下数据清洗data = pd.read_csv('F:/MLdata/d

2021-09-01 15:48:43 841

原创 安装fbprophet遇到的问题(已解决)

ERROR: Failed building wheel for fbprophet首先先更新pippython -m pip install -U pip然后安装一下pystanpip install pystan~=2.14最后也是最重要的一定要安装一下C++链接的编译器,不然你会报错conda install libpython m2w64-toolchain -c msys2然后就可以安装了pip install fbprophet --user...

2021-08-23 02:50:40 5877

原创 JAVA Springboot报错(一)

Could not transfer artifact org.springframework.boot:spring-boot-starter-parent:pom其实问题很简单,是因为电脑挂了代理,可以检查一下代码是否挂了代理或者电脑网络是否挂了代理,关掉就可以了。Tips:网上还有用证书解决的方法,我把链接挂在后面了,如果代理没问题可以试试证书。https://blog.csdn.net/FungLi_notLove/article/details/104469940...

2021-07-23 20:58:45 344

原创 机器学习(四) 决策树

算法原理决策树是基于树结构对问题进行决策或判定的过程。决策过程中提出的判定问题(内部节点)是对某个属性的“测试”,每个测试的结果可以导出最终结论(叶节点)或导出进一步判定问题(下一层内部节点,其考虑范围是在上次决策结果的限定范围之内)。核心是选取划分条件(划分属性)。最终目的样本划分越“纯”越好。常见决策树算法ID3决策树信息熵信息熵可以度量随机变量X的不确定性,信息熵越大越不确定,可转换到度量样本集合纯度,信息熵越小样本集合的纯度越高。样本集合(D)​中第(k)​类样本所占

2021-07-23 01:54:07 1322

原创 ML(三) 线性模型3.4 线性判别分析

线性判别分析(Linear Discriminant Analysis,LDA)笔记部分二分类LDA模型原理给定训练样法将样例投影到一条直线上,使得:同类样例的投影点尽可能接近;异类样例投影点尽可能能远离。在对新样本进行分类时,将其投影到该直线上,再根据投点的位置来确定样本的类别。如下图所示:对应到机器学习三要素中分别为:模型:f(x)=wTxf(\mathbf x)=\mathbf w^T\mathbf xf(x)=wTx。策略:经投影的类内方差尽可能小;经投影的异

2021-07-20 01:36:49 274

原创 ML(三) 线性模型3.3

3.3 对数几率回归笔记部分线性分类模型单调阶跃函数(unit-step function) Heaviside函数不连续、不可微,若预测值大于零就判为正例,小于零则判为反例,预测值为临界值则可任意判别。sigmoid函数——对数几率函数(logistic function)sigmoid函数是形似S的函数。对数几率函数是sigmoid函数的一种,单调可微,其表达式为:与单调阶跃函数的图示关系如下图所示:几率和对数几率若将yyy视为样本作为正例的可能性,则1−y1-y1−y是其反

2021-07-20 00:53:07 163

原创 ML(三)线性模型

3.1线性回归引言在生活中经常会遇到的一些问题,比如犯罪现场留下的鞋码大概估计嫌疑人的身高;又比如通过一个程序员的发际线高度来判断这个程序员的计算机水平;再比如买西瓜的时候,通过某个西瓜色泽、根蒂、敲声等来判断西瓜是好瓜还是坏瓜等等。一个吃过或者见过很多不同类型西瓜的吃瓜人,往往可以根据鉴瓜经验去判断西瓜的好坏。把上面过程抽象出来就是:利用一个已经训练好的带参(θ)模型M(有经验的吃瓜人)根据样本的特征(西瓜色泽、根蒂、敲声等)预测样本的目标值(好瓜/坏瓜)。那么要怎么成为一个有经验的吃瓜

2021-07-20 00:34:56 536

原创 机器学习(学习笔记)二 模型评估与选择(上)

模型评估与选择(上)先画思维导图一、经验误差与过拟合误差:模型对样本的预测结果和样本的真实输出的差异称为 误差。给定一个数据集,将其分割为训练集和测试集训练误差 (Training Error)模型在训练集上的误差称为 训练误差测试误差 (Testing Error)模型在测试集上的误差称为 测试误差1.1 欠拟合 (Underfitting) 和 过拟合 (Overfitting)我们想要的是得到的模型既有小的训练误差,也有小的测试误差,但很多时候事与愿违,造成了模型的欠拟合

2021-07-14 04:26:11 346

原创 机器学习(学习笔记)一

0.导学机器学习:通过计算的手段,利用经验来改善自身性能。人工智能:让机器变得像人一样拥有智能的学科深度学习:神经网络类的机器学习算法在未接触之前,许多人都会觉得机器学习是一门高深的内容,实际上它与人在不断试错尝试中对自己进行反省改进,进而找到事物之中的规律是一个道理。只不过它能在短时间内进行比人多的多的多的尝试,进而能在许多计算领域得到广泛的应用。简单来说,机器学习就是让计算机能像人一样能从数据中学习出规律的一类算法1.绪论先简单的画一下绪论的思维导图1.1 基本术语数

2021-07-14 01:39:00 636 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除