自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

大数据技术派

代码改变世界,代码改变命运! | 微信搜索:大数据技术派

  • 博客(9)
  • 资源 (5)
  • 问答 (1)
  • 收藏
  • 关注

原创 数据分析中的线性代数运算

我们都知道,要想学好数据分析甚至是数据挖掘,线性代数基础是必不可少的。当然了,并不需要多么搞什么的线性代数知识,弄懂向量、矩阵、线性空间应该就够了。这里简单介绍它们在Py...

2019-04-30 21:06:24 1524

转载 HTML解析大法|牛逼的Beautiful Soup!

1.写在前面的话 今天给大家来讲讲强大牛逼的HTML解析库---Beautiful Soup,面对html的解析毫无压力,有多强?下面给大家慢慢道来! ...

2019-04-27 20:25:19 374

转载 利用Word2Vec判断文言、白话文

4个小节,预计用时30分钟。请打开您的电脑,按照步骤一步步完成哦!本教程基于Python 3.5。原创者:SofaSofa TeamM | 修改校对:SofaSofa T...

2019-04-24 21:07:17 1049 2

原创 165cm大于50kg吗——数据标准化有理

数据分析时经常需要数据标准化处理,常见的比如:回归、主成分、因子分析等,在神经网络、聚类分析中也会经常用到数据标准化预处理,甚至感觉一切的数据分析好像都需要标准化预处理。...

2019-04-21 23:08:22 352

原创 基于梯度下降法的——线性回归拟合

阅读本文需要的知识储备:高等数学运筹学Python基础引出梯度下降对于,线性回归问题,上一篇我们用的是最小二乘法,很多人听到这个,或许会说:天杀的最小二乘法,因为很多人对...

2019-04-20 00:00:00 918

原创 第一次赚钱经历,大三时录制在线课程,每月收入3千,生活费是够了?

这里,分享一个自己第一次的赚钱案例!记得大三时候出去实习,我们数学院是在武汉的一个培训机构学习一个月,主要是学Python及大数据基础。说是实习,其实是没有工资的,毕竟是别人给我们上课,怎么还会给我们发工资!我爱学习,晚上回来便会看腾讯课堂的Python课程直播,重要免费!顺便说一下,腾讯课堂直播的套路就是:直播免费课程质量非常高,然后后面付费课程质量一般!有一个直播老师说去年也就是2016年...

2019-04-17 23:09:01 9187 5

原创 基于最小二乘法的线性回归拟合

阅读本文需要的知识储备:高等数学概率论与数理统计Python基础线性回归,其实生活中有很多这样的例子,比如:票价与行车距离、服务质量之间的关系,买房时房价与面积、地域等的...

2019-04-16 20:32:56 2980

转载 K-Means算法、非负矩阵分解(NMF)与图像压缩

K-Means算法是最基础的聚类算法、也是最常用的机器学习算法之一。本教程中,我们利用K-Means对图像中的像素点进行聚类,然后用每个像素所在的簇的中心点来代替每个像素...

2019-04-10 20:14:22 2091 1

原创 多元线性回归、逐步回归、逻辑回归的总结

线性回归,前面用Python从底层一步一个脚印用两种方法实现了回归拟合。在这个高级语言层出不穷的年代,这样做显然不明智,所以我考虑用优秀的数据分析工具——R语言(不敢说最...

2019-04-01 19:54:56 29638 2

Zookeeper单机环境和集群环境搭建

Zookeeper单机环境和集群环境搭建

2023-06-15

虚拟机静态IP及多IP配置

虚拟机静态IP及多IP配置

2023-06-15

基于Zookeeper搭建Kafka高可用集群

基于Zookeeper搭建Kafka高可用集群

2023-06-15

基于Zookeeper搭建Hadoop高可用集群

基于Zookeeper搭建Hadoop高可用集群

2023-06-15

Storm集群环境搭建

Storm集群环境搭建

2023-06-15

Spark开发环境搭建

Spark开发环境搭建

2023-06-15

Spark集群环境搭建

Spark集群环境搭建

2023-06-15

Linux下Python安装

Linux下Python安装

2023-06-15

Linux下JDK安装

Linux下JDK安装

2023-06-15

Linux下Flume的安装

Linux下Flume的安装

2023-06-15

Linux环境下Hive的安装部署

Linux环境下Hive的安装部署

2023-06-15

HBase集群环境搭建

HBase集群环境搭建

2023-06-15

Hadoop集群环境搭建

Hadoop集群环境搭建

2023-06-15

docker 安装 wordpress,通过nginx反向代理,绑定域名,配置https

docker 安装 wordpress,通过nginx反向代理,绑定域名,配置https

2023-06-15

5分钟安装docker教程

5分钟安装docker教程

2023-06-15

2022年Python爬虫最全资料【6年爬虫经验精华总结】

【主要内容】 1. Python爬虫简介与环境安装 - Pythonn环境 - Selenium安装 - Python相关包 2. 基本库的使用 - 爬虫基本原理; - urlib库使用; - requests库使用; - bs4使用; - xpath和lxml使用; - selenium使用; - PyQuery使用; 3. scrapy基本使用 4. Scrapy redis实现分布式爬虫 5. 反爬措施 6. 手机APP爬虫 - 模拟器安装、fiddler、appium、mitmproxy安装; - 抓包工具的使用; - 移动端自动化控制; - 利用mitmproxy抓取存储数据; - apk脱壳反编译; references,学习资料分享 价格可谈,联系我:ddxygq。

2022-07-07

阿里巴巴java开发手册中文版

阿里巴巴java开发手册,高清原版,规范你的java开发习惯,让你的开发习惯与顶级互联网公对齐!

2018-09-02

hive-hbase-handler-1.2.1.jar

hive-hbase-handler-1.2.1.jar解决hive1.2.1,hbase不兼容情况!

2018-08-15

hadoop-2.7.2 windows7环境编译文件(winutils.exe、hadoop.dll)

windows环境下开发hadoop与本地运行,会报错,需要编译win环境hadoop工具 否则,可能会有两种错误: 1、Did not find winutils.exe: java.io.FileNotFoundException; 2、java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$Windows 将里面的bin目录覆盖到hadoop对应bin目录即可

2018-03-07

用matlab编写猜字小游戏

用matlab编写猜字小游戏

2016-10-24

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除