- 博客(8)
- 问答 (1)
- 收藏
- 关注
原创 机器学习之PCA降维
PCA之降维与可视化一、PCA 降维1、使用使用sklearn自带数据集load_breast_cancerfrom sklearn import datasetscancer = datasets.load_breast_cancer()X = cancer.datay = cancer.target2、划分训练测试集from sklearn.model_selection import train_test_splitX_train, X_test, y_train, y_test
2021-11-15 23:54:55
2594
原创 2021-09-11
MAC LightGBM 报错image not found的问题解决:安装libomp即可:brew install libomp
2021-09-11 18:40:58
88
原创 Neo4j 知识图谱系列(二):数据导入
上一段主要做一些基础铺垫,完成Neo4j的安装和基本操作命令。本段落主要实现通过导入数据建立图谱.一、Neo4j导入数据的几种方式:1、通过Cypher create 语句进行数据手工创建;2、Cypther load csv语句,对csv格式的数据进行读取;3、官方neo4j-import 工具, 目前被neo4j-admin import所替代;4、batch-import 工具以上的几种方式各有优劣,对于个人使用中小型数据进行尝试,在数据量和速度上,load和import应该都
2020-09-25 16:38:09
3992
原创 Neo4j 知识图谱系列(一)
最近在研究知识图谱,目前市场上使用使用比较多的图谱包括Neo4j,Arango等。之前在一个商用知识图谱上用过Arango,感觉挺好。这次打算换一下,因为neo4j有免费版本,所以可以有机会自己好好研究下Neo4j的具体应用场景,一、安装免费版本 整个安装过程比较简单,先在Neo4j官网下载community免费版本。安装的过程需要在CMD环境下,比较简答,网上能搜到很多教程。没有出现太多问题。唯一的一个就是目前最新版本的Neo4j-community需要Java11环境支持。这个也不难...
2020-09-24 17:54:11
1667
原创 Pandas (组合)条件取值
利用Pandas对表格数据进行取值或组合筛选以数据集test.xls来举例操作首先导入数据:df = pd.read_excel(“test.xls”)查看数据结构:1、对于匹配或相等类的筛选:columns:STATUS_CN 是指贷款合同的状态,可以看到有很多不同的状态类型:假设我们只需要其中已生效、或者结清的合同列表:进行组合筛选:例如组合合同状态和申请日期进行筛选:2、比较类的筛选假设要取贷款金额高于5000的合同:3、匹配类组合比较类这里的组合匹配与1中类似,假设想
2020-09-18 17:11:58
2096
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人