AI
文章平均质量分 94
flare zhao
AI教育专家、Forbes科技U30、CSDN精英讲师、澳大利亚新南威尔士大学博士、深圳孔雀人才
展开
-
python mysql 多id 变量 数据查询
#excel读取需要查询的id 转为tuple格式id_name = pd.read_csv('ids.csv')print(id_name)id_names = id_name.loc[:,'id'].tolist()id_names = tuple(id_names)print(id_names)import pymysql #引入pymssql模块import pandas ...原创 2020-04-20 19:35:59 · 723 阅读 · 0 评论 -
文件夹excel合并 遍历
# -*- coding: utf-8 -*-#导入需要使用的包import xlrd #读取Excel文件的包import xlsxwriter #将文件写入Excel的包import os#打开一个excel文件def open_xls(file): f = xlrd.open_workbook(file) return f#获取excel中所有的she...原创 2020-04-20 16:08:15 · 182 阅读 · 0 评论 -
dataframe筛选
a = [0,2,3]b = [1,2,3]c = [2,2,4]df = pd.DataFrame([a,b,c],columns=['c1','c2','c3'],index=['i1','i2','i3'])print(df)#单列筛选print(df[df['c1'] > 0])print(df[(df['c1']>0)&(df['c3']>...原创 2020-02-22 19:48:55 · 214 阅读 · 0 评论 -
创建空的DataFrame 赋值 合并
a= ['1','2','3']b=['2','3','4']df = pd.DataFrame([a,b])result =pd.DataFrame()#方法一直接赋值result = df方法二进行合并result = pd.concat([result,df],axis=0)result = pd.concat([result,df],axis=0)result.hea...原创 2020-02-22 18:21:07 · 1967 阅读 · 0 评论 -
Git使用教程
官方教程:https://git-scm.com/book/zh/v1/%E8%B5%B7%E6%AD%A5-%E5%AE%89%E8%A3%85-Gitcsdn完整教程:https://blog.csdn.net/pipisorry/article/details/44588351git安装:在 Ubuntu 这类 Debian 体系的系统上,可以用 apt-get 安装:...原创 2018-08-17 17:59:01 · 953 阅读 · 0 评论 -
理解LSTM(通俗易懂版)
转载自:https://www.jianshu.com/p/95d5c461924c循环神经网络(Recurrent Neural Networks)人对一个问题的思考不会完全从头开始。比如你在阅读本片文章的时,你会根据之前理解过的信息来理解下面看到的文字。在理解当前文字的时候,你并不会忘记之前看过的文字,从头思考当前文字的含义。传统的神经网络并不能做到这一点,这是在对这种序列信息(如语音)进行预测时的一个缺点。比如你想对电影中的每个片段去做事件分类,传统的神经网络是很难通过利用前面的事件信息来转载 2020-09-18 18:12:00 · 848 阅读 · 0 评论 -
各类贝叶斯分类器的不同 高斯朴素贝叶斯 多项式朴素贝叶斯 伯努利朴素贝叶斯 Categorical Naive Bayes(类朴素贝叶斯)
转载自:https://www.cnblogs.com/B-Hanan/p/12871863.html核心思想贝叶斯决策理论的核心思想,即选择具有最高概率的决策。背景:假定p1(x,y)表示点(x,y)属于类别1的概率,p2(x,y)表示点(x,y)属于类别2的概率,那么对于一个新数据点(x,y),可以采用下面的规则来判断它的类别:若p1(x,y)>p2(x,y),那么类别为1; 若p1(x,y)<p2(x,y),那么类别为2.理论基础“属性条件独立性假设”:对于已知类转载 2020-08-26 11:13:51 · 4101 阅读 · 0 评论 -
机器学习算法的应用场景(比如朴素贝叶斯、决策树、K 近邻、SVM、逻辑回归)
转载自:https://www.zhihu.com/question/26726794/answer/151282052没有最好的分类器,只有最合适的分类器。随机森林平均来说最强,但也只在9.9%的数据集上拿到了第一,优点是鲜有短板。SVM的平均水平紧随其后,在10.7%的数据集上拿到第一。神经网络(13.2%)和boosting(~9%)表现不错。数据维度越高,随机森林就比AdaBoost强越多,但是整体不及SVM[2]。数据量越大,神经网络就越强。近邻 (Neare..转载 2020-08-20 16:09:36 · 3840 阅读 · 0 评论 -
Python pip更换安装镜像源
pip国内的一些镜像 阿里云http://mirrors.aliyun.com/pypi/simple/ 中国科技大学https://pypi.mirrors.ustc.edu.cn/simple/ 豆瓣(douban)http://pypi.douban.com/simple/ 清华大学https://pypi.tuna.tsinghua.edu.cn/simple/ 中国科学技术大学http://pypi.mirrors.ustc.edu.cn/simple/...原创 2020-08-17 17:37:30 · 2631 阅读 · 0 评论 -
神经网络MLP求解过程 正向传播 反向传播算法
转载自:https://www.jianshu.com/p/c69cd43c537a引言机器学习栏目记录我在学习Machine Learning过程的一些心得笔记,涵盖线性回归、逻辑回归、Softmax回归、神经网络和SVM等等,主要学习资料来自Standford Andrew Ng老师在Coursera的教程以及UFLDL Tutorial,同时也参考了大量网上的相关资料(在后面列出)。本文主要记录我在学习神经网络过程中的心得笔记,共分为三个部分:Neural network - Repr转载 2020-08-16 11:48:38 · 3229 阅读 · 0 评论 -
机器学习 回归问题正则化:线性回归、岭回归、Lasso回归
转自:https://blog.csdn.net/hzw19920329/article/details/77200475线性回归作为一种回归分析技术,其分析的因变量属于连续型变量,如果因变量转变为离散型变量,将转换为分类问题。回归分析属于有监督学习问题,本博客将重点回顾标准线性回归知识点,并就线性回归中可能出现的问题进行简单探讨,引出线性回归的两个变种岭回归以及Lasso回归,最后通过sklearn库模拟整个回归过程。目录结构线性回归的一般形式 线性回归中可能遇到的问题 过拟合问题及其转载 2020-08-12 15:07:09 · 819 阅读 · 0 评论 -
面试中关于模型过拟合的问题总结
转载自:https://zhuanlan.zhihu.com/p/830610321、什么是过拟合?一句话总结:过拟合:模型在训练集上表现很好,但是在测试集上表现很差,泛化性能差。2、产生过拟合的原因:产生过拟合的主要原因可以有以下3点:1)训练数据不足,有限的训练数据。包括(但不限于)样本数量太少、数据维度太高、抽样方法错误,抽样时没有足够正确考虑业务场景或业务特点等等导致抽出的样本数据不能有效足够代表业务逻辑或业务场景;2)数据有噪声。样本里的噪音数据干扰过大,大到模型过分记转载 2020-08-12 12:45:54 · 656 阅读 · 0 评论 -
sklearn中PCA的使用方法
转载自:https://blog.csdn.net/qq_20135597/article/details/95247381PCA主成分分析(Principal Components Analysis),简称PCA,是一种数据降维技术,用于数据预处理。PCA的一般步骤是:先对原始数据零均值化,然后求协方差矩阵,接着对协方差矩阵求特征向量和特征值,这些特征向量组成了新的特征空间。sklearn.decomposition.PCA(n_components=None, copy=True,转载 2020-08-10 11:42:33 · 933 阅读 · 0 评论 -
主成分分析(PCA)原理详解
转载自:https://www.imooc.com/article/362721.相关背景在许多领域的研究与应用中,通常需要对含有多个变量的数据进行观测,收集大量数据后进行分析寻找规律。多变量大数据集无疑会为研究和应用提供丰富的信息,但是也在一定程度上增加了数据采集的工作量。更重要的是在很多情形下,许多变量之间可能存在相关性,从而增加了问题分析的复杂性。如果分别对每个指标进行分析,分析往往是孤立的,不能完全利用数据中的信息,因此盲目减少指标会损失很多有用的信息,从而产生错误的结论。因此需要找到一转载 2020-08-10 11:38:08 · 1694 阅读 · 0 评论 -
决策树案例及其原理(二):求解方法
转载自:https://www.cnblogs.com/callyblog/p/9724823.htmlID3决策树:利用信息增益来划分节点信息熵是度量样本集合纯度最常用的一种指标。假设样本集合D中第k类样本所占的比重为pk,那么信息熵的计算则为下面的计算方式当这个Ent(D)的值越小,说明样本集合D的纯度就越高有了信息熵,当我选择用样本的某一个属性a来划分样本集合D时,就可以得出用属性a对样本D进行划分所带来的“信息增益”一般来讲,信息增益越大,说明如果用属性a来划分样本集合D转载 2020-08-04 20:22:20 · 366 阅读 · 0 评论 -
决策树案例及其原理(一)
转载自:https://www.jianshu.com/p/af7fd132de30如果你想了解机器学习,决策树是最佳起点之一。决策树是一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别。决策树更是常见的机器学习方法,可以帮助我们解决分类与回归两类问题。以决策树作为起点的原因很简单,因为它非常符合我们人类处理问题的方法,而且逻辑清晰,可解释性好。符合到什么程度?从婴儿到长者,我们每天都使用无数次!本文涵盖6大知识点:知识点1:不转载 2020-08-04 20:16:10 · 534 阅读 · 0 评论 -
机器学习工具包sklearn环境部署:python、anaconda、jupyter notebook
目标:从零部署机器学习开发环境,包括python3.7安装、anaconda安装、虚拟环境部署、jupyter notebook界面优化、简单程序运行1、python安装https://www.python.org/2、anaconda安装https://www.anaconda.com/3、虚拟环境部署为方便后续开发,使用anaconda部署新的开发环境3.1、env...原创 2019-06-20 10:48:34 · 1643 阅读 · 0 评论 -
Keras - Python Deep Learning Neural Network API 课程实现及遇到的坑填满
课程:https://www.youtube.com/watch?v=eCz_DTtUBfo&list=PLZbbT5o_s2xrwRnXk_yCPtnqqo4_u2YGL&index=27使用flask搭建前后端平台主要问题:1.跨域访问异常:添加:from flask_cors import CORSapp = Flask(__name__)CORS(a...原创 2019-01-19 15:39:29 · 463 阅读 · 0 评论 -
计算机视觉常用数据集
转载自:https://blog.csdn.net/qq_38273984/article/details/89217315计算机视觉常用数据集一、图像分类常用数据集 (一)MNIST (二)Kaggle网站“Dogs vs. Cats” 二、目标检测常用数据集 (一)Pascal VOC(Pascal Visual Object Classes) (二)MS COCO(Common Objects in Context) (三)ISLVRC 2012(ImageNet La转载 2020-09-10 13:30:19 · 716 阅读 · 0 评论 -
python sympy求解微积分
前言一般的数学算式math就可以解决了,但是涉及到极限,微积分等知识,math就不行了,程序中无法用符号表示出来。python中有一个sympy科学计算库,专门用来解决数学的运算问题安装pip install sympy -ihttps://pypi.tuna.tsinghua.edu.cn/simple/使用使用时需要先定义变量,通过symbol来实现import sympy as spx = sp.Symbol('x')y = 3*x**2+2print(x..原创 2020-06-07 18:27:07 · 1467 阅读 · 0 评论 -
PCA降维 维度 样本数 feature数
问题:PCA降维后的feature数如果少于样本数,为什么会报错把n_components一旦改为超过230后,会有截图中的错误,即:ValueError: n_components=250 must be between 0 and min(n_samples, n_features)=230 with svd_solver='full'Answer:PCA降维实现的依旧...原创 2020-04-06 10:12:48 · 5511 阅读 · 4 评论 -
课程问题答案-Python3人工智能系统入门与综合提升 机器学习+深度学习 提升实战能力
flare老师的人工智能实战课程“人工智能系统入门与综合提升 机器学习+深度学习+迁移学习”已上线,欢迎小伙伴们学习围观。本课程围绕人工智能核心知识点进行讲解,每个章节包含丰富实战案例,手把手带你利用AI工具解决生活、工作问题(股价预测、人脸识别、语言翻译、异常检测等等)。另外,flare老师的免费课程“P...原创 2020-03-13 00:49:06 · 1001 阅读 · 5 评论 -
Windows、mac os、Linux 安装 Anaconda
本文重点介绍不同系统下的Anaconda安装,软件安装好之后的机器学习开发工具配置教程参考文章:人工智能入门利器介绍及基本环境搭建常用代码备注:新版Anaconda安装后均已配有python,因此不需要预先安装pythonAnaconda 官文网站 https://www.anaconda.com/distribution/ 下载操作系统对应的安装文件,选择 Python 3.7 版本。...原创 2020-03-12 16:42:45 · 1148 阅读 · 0 评论 -
修改Jupyter Notebook默认路径
安装Anaconda以及jupyterlab之后,jupyterlab默认的路径为当前用户的用户路径,一般在C:\Users[username],其中username为当前用户名。那么如何修改jupyterlab的默认路径?1、在Anaconda Navigator中运行Terminal2、查看Jupyter配置文件所在目录:jupyter --config-dir3、切换到该目录,检...原创 2020-03-09 19:30:40 · 345 阅读 · 1 评论 -
人工智能开发 各类问题汇总及解决办法 (不定期更新)
人工智能 机器学习 深度学习 python anaconda jupyter 配置与开发问题汇总及解决办法(不定期更新)–created by flare zhao操作系统 建议对使用的操作系统进行更新,如果系统版本过旧,可能导致Ananconda软件安装失败Python 安装3.7版本,版本并不是越高越高,使用3.8版本在深度学习部分可能存在安装包不兼容问题Anaconda ...原创 2020-03-01 11:04:50 · 1529 阅读 · 1 评论 -
神经网络 分类 sigmoid softmax
在mlp中,新神经元的输出可以理解为,前面很多个神经元信号经过激活函数处理后的结果。这个激活函数是可以调的,二分类任务,最后的激活函数使用sigmoid很适用,类似于逻辑回归。但如果是多分类,而且结果是多类别中的某一个(比如结果是4类中的一类,我们可以理解为这四个类别发生的概率之和为1),那我们可以使用softmax,通过这个激活函数运算,输出为每个类别可能的概率,最大的概率那个,就是本次预测的类...原创 2020-02-28 20:03:03 · 1053 阅读 · 0 评论 -
激活函数sigmoid 、tanh、Relu、Leaky Relu 优缺点对比(最全)
同学你好,这是个很好的问题,flare老师在第8章卷积神经网络的章节也有提及“为什么CNN结构使用relu替代sigmoid作为激活函数”。flare老师和大家分享常用激活函数的优缺点:sigmoid:很直观的反映了二分类任务的事件可能性(概率),通过引入双边极值稳定的非线性函数关系能有效地模拟神经元信息机制,在逻辑回归与神经网络中被广泛使用。缺陷:双边区域数值饱和(x很大或很小)导致随着...原创 2020-02-25 11:07:59 · 19994 阅读 · 1 评论 -
41.7%年化收益率 人工智能买股可以如此简单
学一门知识,充实自我 掌握一项工具,让生活更美好~今天flare老师教大家AI选股,轻松搭建一个年化收益40%的机器学习选股策略—by flare zhao,转载请注明出处,原创不易,谢谢支持话不多说,先看策略的最终表现:2017年12月到2019年12月期间为了让大家有个更直观的感受,我们来看看K线图及策略的净值曲线:接下来,我们再来看看策略的具体交易情况:考虑到文章篇幅限制,...原创 2020-02-23 15:38:02 · 3862 阅读 · 5 评论 -
list转dataframe
list 转化Data Framea = ['a','1','2','c']b = ['b','2','2','c']#转化df = pd.DataFrame([a,b],index=['a','b'])df#转置df_t = df.Tdf_tfinally:flare老师的实战课程“零基础入门人工智能:系统学习+实战”课程已经上线,欢迎小伙伴们订阅,和flare老师一起...原创 2020-02-22 15:05:14 · 780 阅读 · 0 评论 -
人工智能之强化学习-给机器一块糖 让她变得更聪明
2016年3月有件大事,人工智能围棋机器人AlphaGo与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,以4比1的总比分获胜,AlphaGo一举成名,人工智能吸粉无数。接下来一年,AlphaGo版本机器人更是在围棋界所向披靡,2017年5月,在中国乌镇围棋峰会上,AlphaGo Master与排名世界第一的世界围棋冠军柯洁对战,以3比0的总比分获胜。围棋界公认阿尔法围棋的棋力已经超过人类职...原创 2020-02-18 11:10:32 · 875 阅读 · 0 评论 -
人工智能入门利器介绍及基本环境搭建常用代码
pythonPython是一种解释型的、面向对象的、移植性强的高级程序设计语言。开发者:吉多·范罗苏姆(Guide van Rossum)解释性:不需要编译成二进制代码,可以直接从源代码运行面向对象:Python既支持面向过程的编程也支持面向对象的编程可移植性:由于它的开源本质,可在不同平台进行开发高层语言:无须考虑诸如如何管理程序使用的内存一类的底层细节官网:www.python...原创 2020-02-17 19:51:34 · 2651 阅读 · 0 评论 -
机器学习中数据预处理fit(),transform(),fit_transform()的区别
Fit():Method calculates the parameters μ and σ and saves them as internal objects.解释:简单来说,就是求得训练集X的均值啊,方差啊,最大值啊,最小值啊这些训练集X固有的属性。可以理解为一个训练过程Transform():Method using these calculated parameters app...原创 2020-02-13 17:32:53 · 2986 阅读 · 0 评论