- 博客(39)
- 资源 (1)
- 收藏
- 关注
转载 Python 面向对象(进阶篇)
《Python 面向对象(初级篇)》文章介绍了面向对象基本知识:面向对象是一种编程方式,此编程方式的实现是基于对 类 和 对象 的使用类 是一个模板,模板中包装了多个“函数”供使用(可以讲多函数中公用的变量封装到对象中)对象,根据模板创建的实例(即:对象),实例用于调用被包装在类中的函数
2018-02-27 15:46:32 380
转载 Python 面向对象(初级篇)
Python3 面向对象Python从设计之初就已经是一门面向对象的语言,正因为如此,在Python中创建一个类和对象是很容易的。本章节我们将详细介绍Python的面向对象编程。如果你以前没有接触过面向对象的编程语言,那你可能需要先了解一些面向对象语言的一些基本特征,在头脑里头形成一个基本的面向对象的概念,这样有助于你更容易的学习Python的面向对象编程。
2018-02-27 15:44:52 651 1
原创 数据科学家应知必会的6种常见概率分布
本文介绍六种概率分布的原理、举例、均值、方差、期望、概率分布图等,分布分别为伯努利分布、均匀分布、二项分布、正态分布、泊松分布、指数分布;另外介绍各种分布之间的关系和不同
2017-11-28 16:21:11 23175 3
原创 【Python网络爬虫】Python维基百科网页抓取(BeautifulSoup+Urllib2)
本文,我们使用Python中的`“BeautifulSoup`”和`“urllib2”`来研究web抓取方法。 我们也研究了HTML的基础知识,同时一步一步地执行网页抓取。 快用它来从网页收集数据吧!
2017-11-06 21:48:05 7011
翻译 机器学习十大算法总览(含Python3.X和R语言代码)
一监督学习二无监督学习三强化学习四通用机器学习算法列表线性回归Linear Regression逻辑回归Logistic Regression决策树Decision Tree支持向量机SVM Support Vector Machine朴素贝叶斯Naive BayesK近邻KNN K- Nearest NeighborsK均值K-MeansK-means如何形成群类随机森林Random
2017-11-02 12:16:02 4724
翻译 XGBoost中参数调优的完整指南(含Python-3.X代码)
本文实现了端到端的基于XGBoost模型的参数调优。 我们首先讨论为什么XGBoost比GBM具有更好的性能,然后详细讨论了所涉及的各种参数。 我们还定义了一个通用函数,可以重新用于其他模型。
2017-11-01 13:32:15 10661 4
原创 Python时间序列案例分析实战--奶牛产奶量预测
本文主要介绍时间序列ARIMA相关模型的建立及诊断和预测过程。文章首先使用pandas读入数据、整理数据;然后使用test_stationarity函数进行原始数据以及一阶差分数据的平稳性检验,用于满足后边ARIMA模型对于平稳性的要求;之后对数据进行差分,使数据满足平稳性;之后使用网格搜索的方法对最优参数进行初步确定,之后使用statsmodels库中相关的时间序列函数进行时间序列模型AR、MA、ARIMA的识别,
2017-10-23 17:53:55 14434 3
原创 时间序列初级理论篇
前言数学特征1 一般随机变量的数学特征11 期望12 方差13 协方差14 相关系数2 随机变量序列的一些数学特征21 随机变量序列22 均值函数23 自协方差函数24 自相关系数平稳性1 平稳性概念11 严平稳与宽弱平稳111 弱宽平稳时间序列的数学特征2 差分法3 其他变换时间序列影响因素影响因素的叠加平稳时间序列模型介绍1 自回
2017-10-23 09:11:52 5215 2
原创 机器学习损失函数、L1-L2正则化的前世今生
前言:我们学习一个算法总是要有个指标或者多个指标来衡量一下算的好不好,不同的机器学习问题就有了不同的努力目标,今天我们就来聊一聊回归意义下的损失函数、正则化的前世今生,从哪里来,到哪里去。一.L1、L2下的Lasso Regression和Ridge Regression对于机器学习,谈到正则化,首先映入脑子的可能是L1正则化、L2正则化,接着又跑出来Lasso Regressio
2017-09-21 14:22:17 10461 4
原创 Spark2 Linear Regression线性回归
https://www.cnblogs.com/wwxbi/p/6028261.html
2018-07-26 17:02:06 1272
原创 Spark学习: Spark-Scala-IntelliJ编译Jar包流程
Spark-Scala-IntelliJ编译可执行Jar包流程。注意:非Maven环境下,本篇文章接住上一篇文章内容第1步:点击File-project structure-Artifacts,点击+号添加如下 第2步:输入Main class名字(跟运行的主程序名字保持一致),这个可以通过箭头指到的…那里自动选择,防止自己输入错误,点击ok第3步:(重要提醒...
2018-07-20 11:26:27 1712
原创 pip安装库报错:Could not find a version that satisfies the requirement gesim (from versions
使用word2vec需要安装gesim库,传统方法pip install gesim报错: Could not find a version that satisfies the requirement gesim (from versions改正方法,成功安装pip install -U gensim...
2018-07-18 13:05:54 15256
原创 Intellij 创建spark项目的两种方式
Intellij是进行scala开发的一个非常好用的工具,可以非常轻松查看scala源码,当然用它来开发Java也是很爽的,之前一直在用Scala Ide和Eclipse,知道用Maven创建Scala项目工程,一直卡在怎样用Intellij创建Spark工程上,通过搜集资料现把方法总结一下。搜资料发现方式有很多种,但是有的不适合自己的软件版本,也有的比较旧,方法不适用于现在新版本的更新。如果你不...
2018-07-05 11:21:43 1660
转载 markdown编辑器
欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I...
2018-07-03 15:33:57 247
原创 IntelliJ IDEA打jar包--scala class--提交到java或者spark运行
编译文件并且打成jar包,运行jar包第一步:file–>artifacts填写相关内容后返回第二步:build–>build artifacts–>build 在刚刚我们选择的保存目录下找到.jar文件第三步:提交运行在java下运行 在spark-shell中提交运行 不加spark-shell的路径提交也OK...
2018-04-17 12:39:43 1920
原创 IntelliJ IDEA创建Maven项目--Scala
本文主要介绍在IntelliJ IDEA创建Maven项目–Scala的基础步骤。第一步:打开IntelliJ IDEA 第二步:Create New Project–>Maven–>Next 第三步:GroupId->ArtifactId–>Next 第四步:Finish 第五步:在main下右键创建文件夹–>scala 第六步:发...
2018-04-17 11:15:58 9914 3
原创 在hdfs中创建文件夹,出现权限问题
报错:hdmkdir: Permission denied: user=WODAS, access=WRITE, inode=”/user/yimr”:yimr:supergroup:drwxr-xr-x尝试1:失败尝试2:失败尝试3:成功方法–root用户下 su hdfs 解决方法:尽管当前用户是root,但是hadoop 里的hdfs是另外一套文件系统了,...
2018-04-10 14:10:06 15779
原创 TypeError: testFunc() missing 1 required positional argument: 'self'
在Python中,使用类分两步:应该先对类进行实例化;然后在应用类。注意,实例化的过程是应该待括号的。# -*-coding: utf-8 -*-'''在Python中,应该先对类进行实例化,然后在应用类。注意,实例化的过程是应该待括号的。'''class TestClass: def __init__(self): print('In init') def
2018-02-26 09:05:54 14095
原创 You don't appear to have the necessary permissions to install packages
新换了电脑,所以重新配置平时所需要的软件等环境,对pycharm使用Anaconda 的site_packages环境(为了省掉大量安装packages的烦恼),结果使用pycharm安装package时候,遇到了root权限问题,不让访问”C:\PrograData\Anaconda3”,,,。原来wins也有这个root 题。操作系统:win10pychrm:python3.6一、cmd pip
2017-12-16 11:11:42 3520
原创 NSIS Error Installer integrity check has failed.
问题描述:NSIS Error Installer integrity check has failed.
2017-12-11 17:28:38 5423 3
原创 TypeError: parse() got an unexpected keyword argument 'transport_encoding'
环境:win10, Anaconda3(64bit), python3.6.3问题:pip安装keras时出现报错:TypeError: parse() got an unexpected keyword argument ‘transport_encoding’解决办法:在cmd中输入下面代码:conda install -c anaconda html5lib 问是否更新:选择:y经过一系列
2017-12-08 16:27:43 1412
原创 AttributeError: '_io.TextIOWrapper' object has no attribute 'xreadlines'
问题:AttributeError: '_io.TextIOWrapper' object has no attribute 'xreadlines'\color{blue}{\text{AttributeError: '_io.TextIOWrapper' object has no attribute 'xreadlines'}}原因:AttributeError: ‘_io.TextIOWra
2017-11-03 11:33:27 68283 3
原创 UnicodeDecodeError: 'gbk' codec can't decode byte 0xa4 in position 18: illegal multibyte sequence
问题:UnicodeDecodeError: 'gbk' codec can't decode byte 0xa4 in position 18: illegal multibyte sequence\color{red}{\text{UnicodeDecodeError: 'gbk' codec can't decode byte 0xa4 in position 18: illegal m
2017-11-03 11:10:16 4868 2
原创 Linux中hive无法使用Delete和Backspace删除键
在Linux的terminal下输入hive,进入到hive的环境下,输入代码后发现输入有错误时,想用Backspace删除错误命令时,键盘无反应,现在找到症结了,很简单:问题如下红色格格,里面的字母无法删除:解决方法:1. 找到选项框中的 :选项−>会话选项\color{red}{\bf{选项->会话选项}}2.打开会话选
2017-11-02 11:33:47 8131
原创 Python库--pandas库学习笔记总结
CSDN:http://blog.csdn.net/kicilove/article/github代码下载:https://github.com/zhaohuicici?tab=repositories本文主要介绍Python库numpy库中常用函数的使用,代码下载
2017-10-23 18:45:34 1225
原创 Python库--matplotlib库学习笔记总结
CSDN:http://blog.csdn.net/kicilove/article/github:https://github.com/zhaohuicici?tab=repositories本文主要介绍Python库matplotlib常用函数及示例\color{red}{Python库matplotlib常用函数及示例},代码数据
2017-10-23 14:16:43 1329
原创 Python库--numpy学习笔记总结
CSDN:http://blog.csdn.net/kicilove/article/github代码下载:https://github.com/zhaohuicici?tab=repositories本文主要介绍Python库numpy库中常用函数的使用,代码下载
2017-10-23 13:35:25 1240
原创 Tensorflow模拟简单线性模型小栗子
本文通过模拟产生数据,构造简单的线性模型,使用TensorFlow工具,利用梯度下降算法,估计模型系数,给出收敛效果,so, let’s begin , just do it !首先加载我们将要用的的库import tensorflow as tfimport numpy as np模拟产生数据x_data = np.random.rand(100).astype(np.
2017-08-29 09:50:27 1103
原创 根据成绩用Logistic Regression预测学生是否被高校录取--Python版
每年高中生和大学生都会申请进入到各种各样的高校中去。每个学生都有一组唯一的考试分数,成绩和背景数据。录取委员会根据这个数据决定是否接受这些申请者。在这种情况下一个二元分类算法可用于接受或拒绝申请,逻辑回归是个不错的方法。
2017-07-31 10:22:38 5272 1
原创 R语言--异常值检测
自编函数,boxplot()原理outlier.IQR 1.5, replace = FALSE, revalue = NA) { q TRUE) #四分位间距3倍间距以外的认为是离群值 IQR 4] - q[2] x1 2] - multiple * IQR | x > q[4] + multiple * IQR) x2 <- x[x1] if (length(x2)
2017-07-28 15:13:22 20572 2
原创 【数据处理】R语言--data.table -dcast and melt(数据拆分and合并)
R–data.table -dcast and melt(数据拆分and合并)写在前面:数据整形的过程确实和揉面团有些类似,先将数据通过melt()函数将数据揉开,然后再通过dcast()函数将数据重塑成想要的形状 reshape2包: melt-把宽格式数据转化成长格式。 cast-把长格式数据转化成宽格式。(dcast-输出时返回一个数据框。acast-输出时返回
2017-07-25 14:07:09 6637
原创 【数据处理】R语言--data.table介绍以及例子
R—-data.table包介绍学习相比dplyr包,data.table包能够更大程度地提高数据的处理速度,这里就简单介绍一下data.tale包的使用方法。data.table:用于快速处理大数据集的哦数据的读取 data.table包中数据读取的函数:fread()data.table的创建library(data.table)DT = data.table(x=
2017-07-25 13:57:30 4022
原创 【数据处理】R语言--data.table包使用总结
首先下载安装data.table包 install.packages("data.table") library(data.table)利用fread函数导入数据,在data.table包支持使用fread函数从本地或者web上导入数据,功能相当于base包的read.csv。mydata = fread(“https://github.com/arunsrinivasan/sa
2017-07-25 11:13:33 49307 6
原创 机器学习算法源码
《机器学习实战》中的的机器学习算法,使用Python源码相关文章:【关联规则】Apriori算法分析与Python代码实现 【关联规则】Apriori算法分析与Python代码实现【关联规则】FP-Tree算法分析与Python代码实现 【关联规则】FP-Tree算法分析与Python代码实现【决策树算法】基于信息论的三种决策树算法之ID3算法分析与Python代码实现 【决策树算法】基
2017-07-17 12:47:29 1704
原创 R语言中的集合操作
R语言中的集合运算操作,在很多时候可以省掉for循环带来的开销成本。我们知道在集合对元素的操作有并,交,补,取余等,下面直接代码介绍:#集合A> A<-1:10> A [1] 1 2 3 4 5 6 7 8 9 10> #集合B> B<-seq(5,15,2)> B[1] 5 7 9 11 13 15>集合C> C<-1:5> C[1] 1 2 3 4
2017-07-17 10:34:04 6339
原创 Python使用urllib库和BeautifulSoup库爬虫总结
最近简单学习了一点爬虫,为此做一个小的总结,还望批评指正Python爬虫总结检查是否安装成功python pythonurllib from urllib.request import urlopenBeautifulSoup4 from bs4 import BeautifulSoup 存储数据到MySQL通过pip安装pymysql pip install pymysql通过
2017-07-17 10:13:34 2774
原创 Python中if __name__ == "__main__": 的作用
最近在学习Python,在很多Python脚本中在最后的部分会执行一个判断语句if __name__ == "__main__: ,之后还可能会有一些执行语句。那添加这个判断的目的何在?为此搜集了些资料终于明白了,分享给大家。在Python编译器读取源文件的时候会执行它找到的所有代码,而在执行之前会根据当运行的模块是否为主程序而定义变量__name__的值为__main__还是模块名。因此,该判断语
2017-07-17 09:49:52 1414
原创 你想拥有开挂的人生吗?
刚刚从学校毕业转入职场,在这个伟大的时代,遇到了人工智能,出身于统计学,可以说于AI有着天然的联系,所以在进入AI的门槛上相对来说容易了许多
2017-07-12 16:15:49 4208 11
原创 记录成长历程
1. 简介为什么今天第一次比较系统的了解了CSDN 的Markdown使用方法,并且实践了主要的功能表示方法。为以后点滴记录学习及成长历程留下点可以回忆及温习的检索或者是图谱。2. 内容平时学习的课程记录课程的内容自己学到的点及启发自己遇到的问题及解决方案自己的疑问总结工作中的工作中遇到的难点及解决方案学到的启发点未来工作的想法3. 怎么做每周及时学习课程平时工作的时候及时记录
2017-07-12 15:11:19 1204
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人