![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
爆炒小青蛙
人工智能目前只学到人工智障的水平
展开
-
推荐系统-基于用户的协同过滤-python实现(基于电影数据集)
数据可以从这里下载实现过程:1、得到用户兴趣表,横轴为movie_id,纵轴为user_id2、计算任何两位用户之间的相似度或者是相关性3、取与某用户相似度最高的若干个用户的兴趣推荐给该用户(或者找到和每个用户相关系数在阈值以上的用户,并将他们喜欢的电影推荐给该用户)import pandas as pdfrom math import sqrtmovies = pd.read_...原创 2019-07-08 10:54:18 · 6105 阅读 · 2 评论 -
Kaggle项目之PUBG Finish Placement Prediction(一)——探索性分析
数据来自Kaggle,也可以在这里取,提取码wymx。比赛在一个月前结束,这里拿来练练手~多图预警!!1、各变量含义DBNOs - 击倒多少敌人 assists - 伤害过多少敌人(最终该敌人被队友杀害)boosts - 使用过多少个提升性的物品(boost items used)damageDealt - 造成的总伤害-自己所受的伤害headshotKills - 通过爆头而杀死的...原创 2019-03-15 15:45:15 · 5431 阅读 · 5 评论 -
神经网络原理+从零创建两层神经网络(基于Python)
神经网络的参数主要有两大块,一是各神经元之间连接的权重参数,而是表示各功能神经元阈值的偏置参数。通过对损失函数使用梯度下降法,可以找到最优的权重和偏置参数,使得损失函数达到极小。神经网络原理介绍(以二层神经网络为例)如上图所示,一个简单二层神经网络包含输入层、隐层和输出层。输入的数据乘以第一层权重参数矩阵W(1)W^{(1)}W(1)后,到达隐层,经隐层的激活函数h(x)h(x)h(x)作用...原创 2019-02-26 10:11:07 · 1439 阅读 · 1 评论 -
损失函数、梯度和学习率的理解及用python实现梯度下降法
机器学习的最终目标就是获得泛化能力,而什么是泛化能力呢,就是指处理未被观察过的数据(非训练数据)的能力。一、为何要引入损失函数损失函数就是评估一个学习器“恶劣程度”的指标——即描述了当前学习器对训练数据在多大程度上不拟合、不一致。所谓让机器通过“学习”数据信息从而产生一个学习器的过程,就是去寻找最优参数,使得损失函数达到极小甚至最小的过程。而这一过程如何实现?——答案就是求导,而导数就是所谓...原创 2019-02-23 16:43:32 · 5495 阅读 · 3 评论 -
Xgboost生成新特征以及调参演示
注:本文来源于https://github.com/lytforgood/MachineLearningTrick这里只做记录、学习之用Xgboost生成新特征##导入模块使用需要根据实际情况修改xgboost参数from sklearn.model_selection import train_test_splitfrom sklearn import metricsfrom sk...转载 2019-01-11 13:57:00 · 1992 阅读 · 0 评论 -
神经网络和卷积神经网络的精度对比——以手写字体识别案例为例
关于神经网络和卷积神经网络,有一篇整理的很好的博客可供学习:https://blog.csdn.net/u014789266/article/details/53516861这里利用tensorflow库自带的mnist手写字体数据集作为例子,来分别看神经网络和卷积神经网络的识别精度。tensorflow的安装方法在我的另一篇博客里(我的环境是win10+Anaconda3.6)一、BP神经网络导...原创 2018-04-24 16:55:43 · 4090 阅读 · 0 评论 -
Python实现Logistic回归实例——信用卡欺诈检测
信用卡欺诈检测算是一个比较经典的例子了,这里记录一下python的算法。导入三个基本的包,读取数据,发现数据的不平衡性:import numpy as npimport pandas as pdimport matplotlib.pyplot as pltpath=r"D:\learning\data_for_py\creditcard.csv"data=pd.read_csv(path...原创 2018-03-26 21:19:15 · 1965 阅读 · 0 评论 -
笔记——用Requests库和BeautifulSoup库爬取酷狗音乐数据
酷狗音乐top500榜单链接:http://www.kugou.com/yy/rank/home/1-8888.html观察每页的url,将第一页url中home/后的1改成2,就恰好是第二页的url。首先导入相应的库,同时设定好浏览器的header:import requestsfrom bs4 import BeautifulSoupimport timeheaders={ '...原创 2018-03-02 17:00:37 · 2245 阅读 · 1 评论 -
用python求一重积分和二重积分
首先是对一元函数求积分,使用Scipy下的integrate函数:from scipy import integratedef g(x): return (1-x**2)**0.5#用integrate下的quad函数可以同时求出积分结果和误差res,err=integrate.quad(g,-1,1) #-1和1表示积分上下限,如果是正无穷用np.infprint(res,er...原创 2018-02-28 10:07:21 · 9995 阅读 · 1 评论 -
Python爬取豆瓣电影信息
本案例的任务为,爬取豆瓣电影top250的电影信息(包括序号、电影名称、导演和主演、评分以及经典台词),并将信息作为字典形式保存进txt文件。这里只用到requests库,没有用到beautifulsoup库step1:首先获取每一页的源代码,用requests.get函数获取,为了防止请求错误,使用try...except..def getpage(url): try: ...原创 2018-01-31 16:51:44 · 1475 阅读 · 0 评论