自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 docker在阿里云镜像中注册与使用

docker一、docker 安装二、开通容器镜像服务1)注册开通后产品页面2)创建地址唯一的命名空间3)选择相应的区域4)创建本地仓库5)点击管理,查看详情三、编写文件四、提交1)登录docker2)建立镜像3)运行4)推送一、docker 安装windows下载:下载地址:linux下载:手把手详细操作(阿里云)当然也可以去docker官网上按照官网的步骤来,不同的操作系统不太一样。注:vm装镜像的话可能不能调用本地的GPU。二、开通容器镜像服务阿里容器镜像服务也可以在阿里云里搜索“

2021-02-22 00:55:03 1100

原创 知识图谱05

知识图谱一、主体类 AnswerSearching 框架介绍二、代码分模块介绍参考资料基于知识图谱的问题系统一、主体类 AnswerSearching 框架介绍class AnswerSearching: def __init__(self): pass # 主要是根据不同的实体和意图构造cypher查询语句 def question_parser(self, data): """ 主要是根据不同的实体和意图构造cypher查询语

2021-01-17 17:05:13 218

原创 知识图谱04

知识图谱4一、引言二、问答系统(1)问答系统简介(2)Query简介三、主体类 EntityExtractor介绍四、命名实体识别整体思路介绍(1)命名实体识别整体思路介绍五、意图识别任务实践(1)意识识别整体思路介绍(2)意识识别整体思路参考资料一、引言第一部分介绍任务所涉及的背景知识;第二部分则是相应的代码及其注释二、问答系统(1)问答系统简介从知识领域划分:封闭领域:封闭领域系统专注于回答特定领域的问题,由于问题领域受限,系统有比较大的发挥空间,可以导入领域知识或将答案来源全部

2021-01-14 16:51:41 278 1

原创 知识图谱3

知识图谱03一、引言二、Neo4j简介(1)基本概念(2)索引(3)Neo4j的优势三、主体类MedicalGraph介绍一、引言Neo4j 是当前较为主流和先进的原生图数据库之一,提供原生的图数据存储、检索和处理。它由 Neo Technology支持,从 2003 年开始开发,1.0 版本发布于 2010 年,2.0版本发布于 2013 年。经过十多年的发展,Neo4j 获得越来越高的关注度,它已经从一个 Java 领域内的图数据库逐渐发展成为适应多语言多框架的图数据库。Neo4j 支持ACID、集

2021-01-13 23:22:16 130

原创 知识图谱02

知识图谱2一、引言二、运行环境三、搭建知识图谱四、启动问答测试五、踩坑(1)关于路径:(2)报错一、引言主要将项目跑起来,对项目有一个宏观的认识。搭建知识图谱。启动问答测试。构建一个简单的基于知识图谱的对话系统。二、运行环境python3.0及以上neo4j 3.5.0及以上jdk 1.8.0三、搭建知识图谱运行:python build_graph.py或者直接在pycharm中运行。(等待时间较长,静候)运行完成后打开neo4j,会看到如下:点击下图中画圈的部分

2021-01-12 22:06:12 204

原创 知识图谱01

知识图谱一、Neo4j的下载与安装(一)Neo4j下载(二)Neo4j安装二、Neo4j的使用(一)创建结点(二)创建关系(三)创建出生地关系(四)图数据库查询(五)删除和修改三、通过python操作Neo4j(一)neo4j模块:执行CQL(cypher)语句(二)py2neo模块:通过操作python变量,达到目的四、踩过的坑一、Neo4j的下载与安装Neo4j是一个高性能的,NOSQL图形数据库,它将结构化数据存储在网络上而不是表中。(一)Neo4j下载在官网上下载企业版社区版(二)

2021-01-11 23:45:17 132

原创 pandas——综合练习

pandas——综合练习问题一、2002 年-2018 年上海机动车拍照拍卖问题一、2002 年-2018 年上海机动车拍照拍卖(1) 哪一次拍卖的中标率首次小于 5%?(2) 按年统计拍卖最低价的下列统计量:最大值、均值、0.75 分位数,要求 显示在同一张表上。(3) 将第一列时间列拆分成两个列,一列为年份(格式为 20××),另一列为 月份(英语缩写),添加到列表作为第一第二列,并...

2020-05-01 21:25:01 320

原创 pandas——合并

pandas——合并问题练习问题【问题一】 请思考什么是append/assign/combine/update/concat/merge/join各自最适合使用的场景。append:可以利用Series或DataFrame添加行。assign:添加列。例子同上。combine:利用规则在表中填充另一个表的数据update:按索引来覆盖更新数据concat:行/列两个方向拼接两个表...

2020-04-30 23:33:03 336

原创 pandas——变形

pandas——变形问题问题一问题二练习练习一练习二问题问题一【问题一】 上面提到了许多变形函数,如melt/crosstab/pivot/pivot_table/stack/unstack函数,请总结它们各自的使用特点。**melt:**是pivot()逆转操作函数。**crosstab:**用于分组统计。但比groupby()函数显示更加直观。**pivot:**将长...

2020-04-28 23:32:38 195

原创 pandas——分组

pandas——分组一、SAC过程二、groupby(一)基本内容1)根据某一列分组2)根据某几列分组3)组容量与数组4)组的遍历三、聚合(Aggregation)、过滤(Transformation)和融合(Filtration)四、apply五、问题一、SAC过程SAC指的是分组操作中的split-apply-combine过程。split 指将数据按照一定的规则拆分成若干组;apply...

2020-04-26 22:39:30 1093

原创 pandas学习——索引

pandas学习(2)一、单级索引(一)、iloc和loc(二)、布尔索引1)布尔符号2)isin(三)、快速标量索引二、多级索引(一)、创建多级索引1)、直接创建元素1.用元组创建2.用字典创建2)、利用zip创建元组3)通过Array创建4)通过from_product(二)、多层索引切片1)一般切片(三)、多层索引中的slice对象(四)、索引层的交换三、常用索引型函数(一)、where函数...

2020-04-23 22:11:22 148

原创 pandas学习——基础练习

pandas基础一、基本数据结构(一)Series1)创建2)访问(二)DataFrame1)创建2)访问3)修改索引(三)对比二、遇到的问题(一)randn和rand的区别:(二)value_counts统计缺失值(三)df.mean(axis=1)是什么意思?它与df.mean()的结果一样吗?第一问提到的函数也有axis参数吗?怎么使用?三、实例(一)权利游戏(二)科比投篮一、基本数据结构...

2020-04-20 21:46:43 467

原创 二手车价格预测——Task5

二手车价格预测——模型融合一、bagging/boosting(一)bagging(二)boosting(三)区别二、stacking/blending(一)stacking(二)blending三、预览数据四、特征与标签构建(一)提取数值类型特征列名(二)构建训练和测试样本(三)统计标签的基本分布信息(四)缺省值用-1填补五、模型训练与预测(一)利用xgb进行五折交叉验证查看模型的参数效果(二)...

2020-04-04 21:00:56 570

原创 手车交易价格预测——Task4模型调参

二手车交易价格预测——模型调参一、目标二、内容(一)线性回归(二)五折交叉验证(三)模拟真实业务情况一)绘制学习率曲线与验证曲线二)多种模型对比三)非线性模型(四)模型调参一)贪心调参二)Grid Search 调参三)贝叶斯调参三、总结一、目标了解机器学习模型与调参过程二、内容(一)线性回归plt.scatter(train_X['v_9'][subsample_index], t...

2020-04-01 21:37:06 318

原创 二手车交易价格预测——Task3特征工程

二手车交易价格预测——特征工程一、目标二、异常值处理(一)删除异常值三、特征构造(一)构造时间特征(二)构造地区特征四、数据清洗(一)数据分桶(二)删除冗余数据(三)处理数据集中的缺失值(三)标准化和归一化五、特征筛选(一)过滤式(二)包裹式一、目标将数据转换为能更好地表示潜在问题的特征,从而提高机器学习性能。二、异常值处理首先将数据读入,查看其数值,数值类型,然后查看其特征(一般是表格中...

2020-03-28 21:42:43 373

原创 二手车交易价格预测——Task2

二手车交易价格预测——Task2EDA-数据探索性分析一、目标二、载入相关库三、载入数据,并做相关分析(一)特征集(二)数据总览(三)判断数据缺失和异常(四)了解预测值的分布三、特征分类(一)现将要分析的特征单独分离出来(二)价格特征分为**数字特征**和**类型特征**(三)再分别处理3.1查看unique分布四、 数字特征分析(一) 相关性分析(二) 查看几个特征的偏度和峰值(三) 每个数字特...

2020-03-24 20:14:55 934

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除