- 博客(82)
- 资源 (14)
- 收藏
- 关注
原创 强烈收藏,超实用的Linux常用命令
一、文件处理命令1.1 命令格式Linux命令严格区分大小写。命令格式:命令 [-选项] [参数]例:$ ls -la /etc说明:个别命令使用不遵循此格式。 当有多个选项时,可以写一起。 简化选项与完整选项。 -a 等于 --all1.2 目录处理命令1.2.1 显示目录文件:ls命令名称 ls 命令英文原意 list 命令...
2020-03-19 10:38:41 1882 1
原创 强烈安利一波,程序猿学习网站
菜鸟,几年积累下来的一些程序猿学习网站,安利一波!!!一、IT技术社区1.CSDN网址:https://www.csdn.net/CSDN是全球知名中文IT技术交流平台,创建于1999年,包含原创博客、精品问答、职业培训、技术论坛、资源下载等产品服务,提供原创、优质、完整内容的专业IT技术开发社区.。2.开源中国网址:https://www.oschina.net/...
2020-03-07 14:26:23 8580 5
原创 利用Python处理Excel数据——pandas库
新建一个excel表格(table1.csv)用于案例讲解:一、导库import pandas as pdimport numpy as np二、读取数据df = pd.read_excel('table1.xlsx') # 相对路径# df = pd.read_excel(r'E:\Anaconda\hc\dataScience\table1.csv') # 绝对路径...
2020-01-20 19:06:10 13870 1
原创 超实用的8款Chrome插件
1.Infinity新标签页(pro)在启动了infinity新标签页插件以后,用户会看到一个全新的美观简洁的chrome新标签页。如图所示:优势:可添加任意网站(快捷,收集许多不错的网站)。 搜索栏中集合多个搜索引擎。 点击右下角风车切换背景。2.tampermonkey(油猴)一款免费的浏览器扩展,也是最为流行的脚本管理器,用来管理用户的油猴脚本。...
2020-01-12 14:46:03 4335 3
原创 重磅 | 完备的 AI 学习路线
一、基础知识1、数学数学是学不完的,也没有几个人能像博士一样扎实地学好数学基础,入门人工智能领域,其实只需要掌握必要的基础知识就好。AI的数学基础最主要是高等数学、线性代数、概率论与数理统计三门课程,这三门课程是本科必修的。这里整理了一个简易的数学入门文章:数学基础:高等数学https://zhuanlan.zhihu.com/p/36311622数学基础:线性代数...
2019-05-19 11:35:21 1149 3
原创 手把手图文并茂教你掌握 PageRank 算法
一、PageRank 定义PageRank 算法由 Google 创始人 Larry Page 在斯坦福读大学时提出,又称 PR,佩奇排名。主要针对网页进行排名,计算网站的重要性,优化搜索引擎的搜索结果。PR 值是表示其重要性的因子。...
2020-04-17 16:01:24 13774 5
原创 数据量太少怎么办,请认准交叉验证
一、交叉验证交叉验证是在机器学习建立模型和验证模型参数时常用的办法,一般被用于评估一个机器学习模型的表现。更多的情况下,我们也用交叉验证来进行模型选择(model selection)。交叉验证,顾名思义,就是重复的使用数据,把得到的样本数据进行切分,组合为不同的训练集和测试集,用训练集来训练模型,用测试集来评估模型预测的好坏。在此基础上可以得到多组不同的训练集和测试集,某次训练集中的某样本在...
2020-04-15 10:25:41 15127 4
原创 【PyTorch学习】分别使用Numpy和Tensor及Antograd实现机器学习
本文分别用Numpy、Tensor、autograd来实现同一个机器学习任务,比较它们之间的异同及各自优缺点,从而加深大家对PyTorch的理解。一、使用Numpy实现机器学习首先,我们用最原始的Numpy实现有关回归的一个机器学习任务,不用PyTorch中的包或类。主要步骤包括:首先,给出一个数组x,然后基于表达式y=3x2+2,加上一些噪音数据到达另一组数据y。 然后,构建一...
2020-04-14 10:55:28 1004
原创 【PyTorch学习】全方位介绍Tensor
目录一、 Tensor概述二、创建Tensor三、修改Tensor形状四、索引操作五、广播机制六、逐元素操作七、归并操作八、比较操作九、矩阵操作十、PyTorch与Numpy比较PyTorch的Tensor,它可以是零维(又称为标量或一个数)、一维、二维及多维的数组。Tensor自称为神经网络界的Numpy,它与Numpy相似,二者可以共享内存,且之间...
2020-04-11 20:19:00 913
原创 【机器学习实战】科学处理鸢尾花数据集
目录一、案例分析二、数据处理2.1 回答问题2.2 检查数据2.3清理数据2.4 测试数据三、用 scikit-learn 来预测数据3.1选出特征 (输入变量) 和标记 (输出变量)3.2划分训练集和测试集3.3 用模型来学习四、思考题一、案例分析假设我们要创建一个智能手机应用程序,从智能手机拍摄的照片中自动识别花的种类。 我们需创建一个...
2020-04-10 16:02:39 17838
原创 相当实用的Python格式化字符串
格式化字符串(string formatting)是以指定输出参数格式和相对位置来“美化”字符串。输出参数格式包括数字的小数点位数、字符串大小写等,相对位置标注出被格式化的词是在句中的位置。比如:print('It costs %.2f.' %(123.456))It costs 123.46.其中%.2f是 123.456 的输出参数格式,.2f代表保留小数点两位,而%....
2020-04-10 13:57:11 244
原创 14个python代码,短小精悍,非常实用
在当今数字化时代,Python语言因易懂、易维护、具有丰富的功能函数等特点,被广泛应用于各行各业中。"冰冻三尺非一日之寒,水滴石穿非一日之功",想学好一门语言最重要的方法就是日常积累和实践,今天这篇文章将给大家分享一些看似简单,日常工作中却非常实用的函数及技巧。1. argpartition()借助于 argpartition(),Numpy 可以找出 N 个最大数值的索引,也会将找到...
2020-04-08 20:55:36 3215
原创 【Python库系列】超详细的NumPy入门
前提:导入numpy库。import numpy as np一、数组的创建1.1 创建数组创建numpy数组的三种方式: 按步就班法:np.array() 用在列表和元组上 定隔定点法:np.arange() 和np.linspace() 一步登天法:np.ones(),np.zeros(),np.eye() 和np.random.random()...
2020-04-05 16:04:36 1126 1
原创 【机器学习实战】利用EM聚类算法对王者荣耀英雄进行聚类
目录一、EM算法的步骤二、EM算法的工作原理二、在sklearn中创建GMM模型三、工作流程三、实战环节1. 导包2. 加载数据3. 数据可视化分析4. 特征工程5. 数据规范化6. 建模并产生结果,写入文件7. 显示聚类后的结果8. 聚类结果的评估本篇理论性不多,主要是部分总结及实战内容。一、EM算法的步骤EM算法(英文叫做E...
2020-04-03 17:11:32 3737 2
原创 十大经典排序算法的步骤、演示及Python实现
一、排序算法比较名词解释:n:数据规模 k:"桶"的个数 In-place:占用常数内存,不占用额外内存 Out-place:占用额外内存 稳定性:排序后 2 个相等键值的顺序和排序之前它们的顺序相同二、利用python实现排序算法2.1 冒泡排序1. 算法步骤 比较相邻的元素。如果第一个比第二个大,就交换他们两个; 对每一对相邻元素做同样的...
2020-04-03 13:02:58 943
原创 【白话深度学习】轻松了解几种常用的激活函数
目录一、什么是激活函数二、神经网络的激活函数为什么必须使用非线性函数三、几种激活函数3.1阶跃函数1. 阶跃函数的实现2. 阶跃函数的图形3.2sigmoid函数1.sigmoid函数的实现2. sigmoid函数的图形3.3 ReLU函数1. ReLu函数的实现2. ReLu函数的图形3.4softmax函数1. softmax函...
2020-03-31 21:01:09 3040
原创 【PyTorch学习】PyTorch基础知识
一、Pytorch介绍1.1 什么是PytorchPyTorch 是 Torch7 团队开发的,从它的名字就可以看出,其与 Torch 的不同之处在于 PyTorch 使用了 Python 作为开发语言。PyTorch 既可以看做加入了 GPU 支持的 numpy,同时也可以看 成一个拥有自动求导功能的强大的深度神经网络,除了 Facebook之外,它还已经被 Twitter、CMU ...
2020-03-30 20:25:45 2405
原创 【机器学习实战】利用KNN和其他分类器对手写数字进行识别
一、在sklearn中创建KNN分类器如果是做分类,你需要引用:from sklearn.neihbors import KNeighborsClassifier 如果是回归, 需要引用:from sklearn.neighbors import KNeighborsRegressorKNeighborsClassifier(n_neighbors=5, weights='uniform'...
2020-03-26 18:55:53 9817 1
原创 安装GPU版本pytorch教程(避坑)
Pytorch官方网站:https://pytorch.org/最好用管理员权限打开anaconda prompt之后再安装就没问题了可能会提示你 pip太旧了,update一下1python-mpipinstall--upgradepip正在上传…重新上传取消但依然提示 超时,解决方案就是 pip换源,也可以在每次pip install的最后面加...
2020-03-26 17:01:55 53342 25
原创 pd.read_csv() 和pd.to_csv() 常用参数
一、pd.read_csv()作用:将csv文件读入并转化为数据框形式。filepath_or_buffer: Union[str, pathlib.Path, IO[~AnyStr]], sep=',', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, p...
2020-03-24 11:18:47 10800 1
原创 【机器学习实战】多项式回归
目录:一、介绍二、多项式回归三、scikit-learn中的多项式回归四、关于PolynomialFeatures五、sklearn中的Pipeline一、介绍直线回归研究的是一个因变量与一个自变量之间的回归问题。多项式回归(Polynomial Regression)研究的是一个因变量与一个或多个自变量间多项式的回归分析方法。多项式回归模型是线性回归模型的一种...
2020-03-07 20:28:08 1201
原创 【机器学习实战】数据归一化
一、介绍为什么需要进行数据归一化?举个简单的例子。在下列的散点图中,可知,横轴的值相比于竖轴而言很小,倘若对于一个分类问题,采用KNN算法时求每两个点之间的距离时,倘若数据不归一化的话,因横轴上的数值作用十分小,很容易导致出现严重的误差。因此需要对数据归一化。两种数据归一化的方法:最值归一化(Normalization):把所有数据映射到0-1之间。适用于分布有明显边界...
2020-03-07 11:32:27 1826
原创 【机器学习实战】性能指标之回归问题
一、前言我们可以使用各种指标来评估ML算法,分类以及回归算法的性能。我们必须谨慎选择评估ML性能的指标,因为 如何测量和比较ML算法的性能完全取决于您选择的指标。 您如何权衡各种特征在结果中的重要性,将完全取决于您选择的指标。 二、回归问题的性能指标在这里,我们将讨论各种性能指标,这些指标可用于评估回归问题的预测。1.平均绝对误差(MAE)它是用于回归问...
2020-03-06 13:46:25 1158
原创 【机器学习实战】线性回归
一、介绍线性回归可以定义为统计模型,用于分析因变量与给定的一组自变量之间的线性关系。变量之间的线性关系意味着,当一个或多个自变量的值更改(增加或减少)时,因变量的值也将相应更改(增加或减少)。数学上的关系可以借助以下方程式来表示:Y = aX + b在这里,Y是我们试图预测的因变量,X是我们用来进行预测的自变量,a是回归线的斜率,b是一个常数,称为截距。1.线性回归的...
2020-03-05 20:46:01 3291 1
原创 白话机器学习之KNN算法
大家好,我是AI阿聪,入门机器学习算法小白。这篇主要讲述机器学习算法之KNN算法。我将从以下几个方面介绍它:KNN介绍,工作流程,示例,用Python实现,KNN优缺点及其应用等。希望大家能 get 它哦!
2020-03-05 13:25:38 1140
原创 轻松上手Markdown
一、简介Markdown 是一种轻量级标记语言,它允许人们使用易读易写的纯文本格式编写文档。 Markdown 语言在 2004 由约翰·格鲁伯(英语:John Gruber)创建。 Markdown 编写的文档可以导出 HTML 、Word、图像、PDF、Epub 等多种格式的文档。 Markdown 编写的文档后缀为.md,.markdown。二、应用Markdown 能被...
2020-03-04 14:48:35 581
原创 词云可视化——四行代码轻松上手
所需的Python第三方模块:wordcloud、imageio、jieba与matplotlib安装命令如:pip install wordcloud1号词云:(四行代码上手)# 导入词云制作第三方库wordcloudimport wordcloud# 创建词云对象,赋值给w,现在w就表示了一个词云对象w = wordcloud.WordCloud()# 调用词云...
2020-02-27 11:17:25 1338
原创 简单介绍下机器学习入门知识
大家好,这篇文章主要是简单介绍机器学习入门知识,主要从以下几个方面介绍:1. 什么是机器学习、2. 为什么要使用机器学习、3. 机器学习系统的种类(监督/无监督学习、半监督学习、强化学习、批量学习和线上学习、基于实例学习与基于模型学习)、4. 机器学习的重要挑战、 5. 过拟合和欠拟合、 6. 测试和验证、7. 没有免费午餐公理、8. 总结。这些将是学习机器学习算法必备的一些入门知识哦,你也值得一看!
2020-02-22 15:07:08 851
原创 下载及安装TeXLive和TeXStudio
先介绍TeX、LaTeX、TeXLive、TeXStudio这几个概念:TeX是一种语言,类似于Java和C之类的计算机语言; LaTeX是TeX的扩展,又称为宏集,简单说就是TeX的命令太原始了,为了方便作者写作,Leslie Lamport给TeX语言加入了很多新的功能,这些他写的功能跟TeX加在一起被称为LaTeX。LaTeX当然也是一门语言,是基于TeX的一门语言; TeXLive...
2020-02-16 20:02:22 3863 1
原创 利用Python处理Excel数据——xlrd,xlwt库
当面对成百上千个excel文件,需要重复读写时,你会不会很头大呢?与其花费好几天去做这些繁琐无意义的操作,不如学学python如何批量读写excel文件,以下介绍用xlrd和xlwt库处理Excel数据。我们新建一个excel表格(table1.xlsx)用于案例讲解:一、使用xlrd库读取excel数据1、python读取excel文件特定数据import x...
2020-01-15 14:14:22 11123 3
原创 Matplotlib入门(50题)
简介Matplotlib可能是 Python 2D-绘图领域使用最广泛的套件。它可与 NumPy 一起使用,提供了一种有效的 MatLab 开源替代方案,也可以和图形工具包一起使用。它能让使用者很轻松地将数据图形化,可以说是现在 python 数据分析中,用的人最多的图形库了。一、导入1.导入Matplotlib库简写为 pltimport matplotlib.pyplot...
2020-01-14 22:16:49 6161 1
原创 Anaconda安装库出现ProxyError错误
1.Anaconda安装库出现如下报错内容:ProxyError: Conda cannot proceed due to an error in your proxy configuration.Check for typos and other configuration errors in any '.netrc' file in your home directory,any envi...
2020-01-09 19:45:51 21942 17
原创 Tensorflow 基础知识(二)——四则运算
import tensorflow as tfdata1 = tf.constant(6)data2 = tf.constant(2)dataAdd = tf.add(data1,data2) # 加法dataMul = tf.multiply(data1,data2) # 乘法dataSub = tf.subtract(data1,data2) # 减法dataDiv =...
2019-10-27 20:23:28 656
原创 Tensorflow 基础知识(一)——常量变量
# opencv tensorflow# 类比 语法 api 原理# 基础数据类型 运算符 流程 字典 数组import tensorflow as tfdata1 = tf.constant(2.5) # 常量,不带类型data2 = tf.constant(2,dtype=tf.int32) # 常量,带类型data3 = tf.Variable(10,name='var') #...
2019-10-24 14:30:17 527
原创 在Anaconda导入opencv-python包:解决import cv2问题
1.首先在网址(https://www.lfd.uci.edu/~gohlke/pythonlibs/#opencv)下载适合电脑配置版本的:2.复制到自己anaconda的site-packages下:3.在这个文件夹的空白处右键,打开 Git Bash命令行输入:pip install opencv_python-3.4.3-cp36-cp36m-win_amd64...
2019-10-21 16:40:08 9029
原创 在Anaconda新环境导入tensorflow
1.首先运行开始菜单->Anaconda3—>Anaconda Navigator创建新环境(如:tensorflow)2.其次运行开始菜单->Anaconda3—>Anaconda Promot(anaconda)输入: activatetensorflow3.输入:conda install tensorflow即可导入t...
2019-10-21 16:21:26 2967 1
原创 使用Spring Tool Suite来创建Gradle工程
Gradle是一个基于Apache Ant和Apache Maven概念的项目自动化构建开源工具。它使用一种基于Groovy的特定领域语言(DSL)来声明项目设置,抛弃了基于XML的各种繁琐配置。步骤1.下载Spring Tool Suite,网址为:https://spring.io/tools2.下载Gradle,网址为:https://gradle.org/install/3...
2019-10-19 12:46:56 1637
原创 修改jupyter工作路径和浏览器路径
1、修改jupyter工作路径初次使用anaconda中自带的jupyter,打开后默认工作路径为C:\Users\Admin(自己的用户名)需要更换工作路径:更换方式如下:打开C:\Users\Admin(自己的用户名)\.jupyter->jupyter_notebook_config.py找到#c.NotebookApp.notebook_dir...
2019-10-17 13:17:07 1172 1
原创 Oracle数据库模式对象管理
1.打开SQL Plus,以system用户登录BOOKSALE数据库。system/tiger @booksale2.按下列方式创建一个用户bs,并给该用户授权。create user bs identified by bs default tablespace users;grant resource,connect,create view to bs;3.使用bs用户登录...
2019-05-10 19:34:13 5890
原创 Oracle数据库——序列的创建
1.序列的定义(1)序列的概念①序列用于产生唯一序号的数据库对象,可以为多个数据库用户依次生成不重复的连续整数,通常使用序列自动生成表中的主键值②序列产生的数字最大长度可达到38位十进制数。序列不占用实际的存储空间,在数据字典中只存储序列的定义描述(2)序列的特点①可以为表中的记录自动产生唯一序号②由用户创建并且可以被多个用户共享③典型应用是生成主键值,用于标识记录...
2019-05-09 19:32:43 7872
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人