自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

转载 任务栏程序图标显示白色的解决方法

问题:电脑任务栏锁定的某程序图标显示为白色,而其它图标显示正常。解决:1."win”+“R键”弹出运行窗口,输入%APPDATA%\Microsoft\Internet Explorer\Quick Launch\User Pinned\TaskBar2.在弹出的TaskBar文件夹中,发现没有图标显示异常的快捷方式。将该程序的快捷方式放入到TaskBar文件夹3.重新运行该程序,若未恢复图标,在任务栏上右键点击【固定到任务栏】再取消固定,可以发现图标显示正常。———————————————

2020-05-13 20:50:55 2076

原创 修改环境变量中的一行变成列表形式

针对环境变量都是一行变成原来的列表例如如果你想变成下面这样只需要在一行的最前面加上C:\Windows\System64;尽量加个分号,点击完成重新打开就变回列表了

2020-05-10 12:24:10 2539 4

原创 数据结构算法之python实现八皇后问题

数据结构算法之python实现八皇后问题所谓八皇后问题就是在一张8*8的二位数组中在该数组的每一行(每一列)都放上一个棋,最终需要在这个二维数组上面放8个棋,且这8个棋要满足任意两个棋子之间不能出现在同一行或者同一列或者同一斜线上面,最后求出有多少种摆法实现的一个过程首先准备一个长度为8的列表,这里我使用的是用一个列表来表示过程:最终的结果是打印该列表,结果有多少个就说明有多...

2020-04-24 13:19:14 298

原创 如何在新的电脑中搭建环境

新的电脑中是什么都没有的 首选我们就需要去官网下载一个pip包项目中的所有依赖包命令:pip freeze > requirements.txt在另一个项目中安装上面的依赖包: pip install -r requirements.txt创建虚拟环境mkvirtualenv -p python3 虚拟环境名称例 :mkvirtualenv -p python3 django...

2020-03-07 16:00:01 382

原创 redis内存淘汰策略

LRU (Least recently used, 最近很少使用)思想: 越最近使用过的数据,接下来使用的机会越大,越应该保留,剔除哪些很久之前使用过的数据新数据插入到列表头部;每当缓存命中(即缓存数据被访问),则将数据移到列表头部;当列表满的时候,将列表尾部的数据丢弃。LFU(Least Frequently Used 最近频繁使用算法)思想:使用的次数越高(频率),接下来使用...

2020-02-05 12:58:06 89

原创 及时通讯

在线推送适用于APP 网页自己使用即时通讯技术来搭建引入第三方服务自己写socket离线推送适用于APPIOS使用苹果的服务 APNSandrios 使用googleFCM服务 国内服务器方案HTTP/1.x 协议轮询comet**Websocket **协议HTML5定义了Websocket协议是真正的长连接,来完成双方互传数据Websocket是一种再...

2020-01-11 13:34:30 383

原创 windows的黑窗口中创建虚拟环境

第一步:在cmd + r 创建一个文件第二步:进入文件输入 python -m venv 虚拟环境名字第三步: .\虚拟环境名字\Scripts\activate退出虚拟环境: .\虚拟环境名字\Scripts\deactivate.bat...

2020-01-03 12:20:47 376

原创 Spark基本概念笔记

Spark的认识Spark的概念Spark是一款基于内存的计算引擎,它的计算速度非常快.但是仅仅只涉及到数据的计算,并没有涉及到数据的存储Spark的优点MapReduce 框架的局限性Map结果写磁盘,Reduce写HDFS,多个MR之间通过HDFS交换数据任务调度和启动的开销大无法充分利用内存不适合迭代计算(机器学习, 图计算等等),交互式处理(数据挖掘)不适合...

2019-12-21 17:42:48 131

原创 Hbase笔记

HBase的基本概念HBase是一个分布式的.面向列的开源数据库HBase时Google Big Table的开源实现HBase不同于一般的关系数据库,适合非结构化数据存储Big TableBig Tble是Google设计的分布式数据库存储系统,用来处理海量数据的一种非关系型的数据库适合大规模海量数据,PB级数据分布式,并发数据处理,效率极高易于拓展,支持动态伸缩适用...

2019-12-19 21:49:31 155

原创 Hive笔记

Hive的基本概念Hive是由Facebook实现并开源的,是基于hadoop的一个数据仓库工具,他的作用就是将结构化的数据映射为一张数据库表,并提供HQL(Hive SQL)语句的查询功能,底层数据是存储在HDFS上.HIve的本质:将SQL语句转换为MapReduce任务运行,使不熟悉MapReduce的用户很方便利用HQL处理计算HDFS上的结构化的数据,是一款基于HDFS的MapRe...

2019-12-18 16:44:27 162

原创 Hadoop笔记

Hadoop的概念可拓展:可以由一台服务器拓展到数千台计算机,每台计算机都提供本地计算和存储可靠的:不依靠硬件来提供高可用性,而是在应用检测和处理故障,从而在计算机集群上提供高可用服务Hadoop能用来做什么搭建大型数据仓库PB级别的数据存储,处理,分析,统计业务搜索引擎日志分析数据挖掘商业智能(BI)Hadoop的发展史2003-2004年Google发表了三...

2019-12-17 17:46:35 237

原创 Hadoop生态系统

Hadoop生态系统狭义的HadoopHadoop的三大核心组件 HDFS, MapReduce,YARN广义的Hadoop​ HDFS:文件存储系统基于硬盘​ YARN:资源调度框架​ MapReduce:分布式处理框架​ Hive:数据仓库​ RConnections:数据分析​ Mahout:机器学习库​ pig:脚本语言,跟Hive类似​ Oozie...

2019-12-17 17:42:37 252

原创 集成学习算法

集成学习通过建立几个模型来解决单一预测问题原理: 生成多个学习器或者模型,各自独立地学习和做出预测,这些预测最后结合成组合预测,因此优于任何一个单分类的做出预测机器学习的两个核心人物如何优化训练数据 主要用于解决欠拟合问题如何提升泛化性能 主要用于解决过拟合问题集成学习中的Boosting和Bagging解决欠拟合问题:Boosting解决过拟合问题:Bagging...

2019-12-16 17:42:20 257

原创 聚类算法

应用场景:用户画像,广告推荐等等一种典型的无监督学习算法,主要将相似的样本自动归到一个类别中,计算样本之间的相似性,一般使用欧式距离聚类算法和分类算法的区别:聚类算法时无监督的学习算法分类算法属于监督的学习算法流程:事先确定常数K,常数K意味着最终聚类类别数随机选定初始点为质心,并通过计算每一个样本与质心之间的相似度(欧氏距离),将样本点归到最相似的类中重新计算每个类的质...

2019-12-15 16:01:38 530

原创 决策树算法 ID3 C4.5 CART

一种树形结构,其中每个内部节点表示一个属性上的判断,每个分支代表一个判断结果的输出,最后每个叶节点代表一种分类结构,本质是一颗由多个判断节点组成的树原理系统的混乱程度,系统越混乱或者分散,熵值越高,反之越低从信息的完整性上:数据越集中的地方熵值越小,数据越分散的地方熵值越大从信息的有序上系统越有序,熵值越低,系统越混乱或分散熵值越大信息熵的定义Ent(D)...

2019-12-14 18:31:11 777

原创 逻辑回归算法

应用的场景: 广告的点击率 , 是否为垃圾邮件, 是否患病等从应用场景来看 逻辑回归解决的就是二分类的问题原理输入值:线性回归的输出激活函数: sigmoid函数判断的标准:回归的结果输入到sigmoid函数中输出结果:[0,1]区间中的一个概率值,默认为0.5为阈值损失线性回归逻辑回归最小二乘法对数似然分开类别:...

2019-12-13 20:24:42 430

原创 K紧邻算法

K紧邻通俗的讲: 就是通过你的邻居来判断你是那个类别的通过距离来计算 一般是欧氏距离sklearn.neighbors.KNeighborsClassifier(n_neighbors=5)n_neighbors:int,可选(默认= 5),k_neighbors查询默认使用的邻居数sklearn的优势:文档多,且规范包含的算法多实现起来容易各种...

2019-12-12 15:46:37 426

原创 线性回归算法

线性回归利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间的关系进行建模的一种分析方式线性回归主要有两种模型 线性关系 非线性关系sklearn.linear_model.LinearRegression()​ LinearRegression.coef_:回归系数线性回归的损失和优化损失函数yi为第i个训练样本的真实值h(xi)...

2019-12-11 21:42:20 383

原创 协同过滤

协同过滤算法算法思想:物以类聚,人以群分基本的协同过滤推荐算法基于以下假设:“跟你喜好相似的人喜欢的东西你也很很大可能喜欢” :基于用户的协同过滤推荐(User-based CF)“跟你喜欢的东西相似的东西你也很有可能喜欢 ”:基于物品的协同过滤推荐(Item-based CF)实现协同过滤推荐有以下几个步骤:找出最相似的人或物品:TOP-N相似的人或物品通过计算两两的相似度...

2019-12-11 17:44:04 472

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除