![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
pyhton机器学习
文章平均质量分 95
分享工作中Python的一些笔记,好记性不如烂笔头
带问号的小朋友
这个作者很懒,什么都没留下…
展开
-
从0到1构建一个基于知识图谱的智能问答系统
前言基于知识图谱的问答系统(Knowledge-Based Question Answering system: KBQA)在以下场景下比较有优势:对于领域类型是结构化数据场景:电商、医药、系统运维(微服务、服务器、事件)、产品支持系统等,其中作为问答系统的参考对象已经是结构化数据;问题的解答过程涉及多跳查询,比如“周杰伦的妈妈今年是本命年吗?”,“你们家的产品 v1 和 v2 的区别是什么?”;为了解决其他需求(风控、推荐、管理),已经构建了图结构数据、知识图谱的情况。KBQA简单讲就是将把原创 2022-07-09 16:46:43 · 12467 阅读 · 6 评论 -
凸优化简单梳理
赵老师的这门人工智能基础课讲得实在太快了,内容又多,囫囵吞枣都咽不下去,所以抽个时间简单记录些零零散散的知识点。。。凸集定义:集合C内任意两点间的线段均在集合C内,则称集合C为凸集,即:然后拓展到K个点即:例如:超平面、半空间、多面体超平面hyperplane: {x ∣ aT x = b}如果向量a乘以X等于b,则这个表达的任意的x就代表超平面。如果将等号变为大于等于或者小于等于,则这个任意的x就代表超平面所确定的半空间。半平面(半空间)halfspace: {x ∣ aT x原创 2021-03-31 18:15:29 · 585 阅读 · 0 评论 -
分类问题学习笔记-朴素贝叶斯
文章目录朴素贝叶斯案例算法原理如何处理连续值算法的优缺点优点缺点Python朴素贝叶斯案例按照以往,我们首先通过一个例子来感受一下,来看看它到底有多朴素。大学上概率论的时候老师大都举过这样一个例子:抽奖盒里有三张券,只有一张中大奖 ,你抽了一张还没刮,小明抽了一张,刮开没中。这时候剩下最后一张中奖的概率是多少?他要跟你换你换吗?从直觉上来讲,你中奖的概率是1/3,你最先抽了一张,不管咋操作,中奖的概率应该都是1/3。这时候小明排除掉了一张没中奖的,剩下两张必有一张中奖,所以概率是1/2。是这样吗?原创 2020-12-22 16:09:27 · 251 阅读 · 0 评论 -
kaggle入门学习demo——Titanic: Machine Learning from Disaster
系列文章目录分类问题学习笔记——KNN分类问题学习笔记——决策树文章目录预测泰坦尼克号上的生存状况,熟悉ML基础知识1.下载数据集,了解字段含义2.数据清洗1)特征选择2)缺失值填充3)string型分类字段转码2.模型训练预测泰坦尼克号上的生存状况,熟悉ML基础知识1.下载数据集,了解字段含义首先去比赛界面下载数据集https://www.kaggle.com/c/titanic/dataimport pandas as pdimport numpy as npimport ran原创 2020-11-18 14:35:53 · 325 阅读 · 0 评论 -
分类问题学习笔记-决策树
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录决策树案例:原理:基于信息论的三种决策树算法:1、ID3算法**信息熵:****案例:**ID3算法的不足2、C4.5算法3、CART算法优点:缺点:关于剪枝:python鸢尾花案例:决策树案例:假如现在我想买一个西瓜,需要判断好瓜,还是坏瓜。西瓜拿过来后先看纹理,纹理如果不清晰直接pass,纹理清晰的再看根蒂,触感等其他特征,如果我此时构建了一颗决策树,没问题,马上就可以知道是好瓜,还是坏瓜,如下图所示:原理:决策树原创 2020-11-16 17:27:05 · 819 阅读 · 0 评论 -
分类问题学习笔记-KNN原理
最邻近算法-KNN案例:kNN算法的指导思想是“近朱者赤,近墨者黑”,由你的邻居来推断出你的类别。俗话讲“物以类聚,人以群分”。 试想有甲乙两个人,甲住进了汤臣一品的豪宅,乙住进了郊区老破小,那我们最直观的判断就是:甲大概率是个有钱人,乙嘛,平平无奇。即时我们没见过甲乙的银行卡余额,但通过甲住进了富人小区仍然可以做出判断。引出KNN算法思路“你住的离谁近,就大概率跟他是同一类人”。定义——From Wikipedia:In pattern recognition, the k-nearest ne原创 2020-11-16 16:20:51 · 686 阅读 · 0 评论 -
Python 读取csv、pandas多表join、时间与时间戳转换、判断是否当月第一天
Python1.读取csv文件工作中会用到读取csv的场景,但是又不想所有的列都读。。所以记录下怎样选择读取# 这里usecols参数选择要第几列df_info = pd.read_csv('/data/share/' + ts + '_user_mgmt.csv.gz',usecols=[0, 5, 10, 11], low_memory=False)# 读完之后可能会有索引列 ,去掉 unnamed:0 列df = df.loc[:, ~df.columns.str.contains('U原创 2020-07-20 18:14:02 · 1121 阅读 · 1 评论