自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

web crawler/python/NLP

  • 博客(78)
  • 资源 (1)
  • 问答 (2)
  • 收藏
  • 关注

转载 python 量子电路模拟库qiskit

import mathfrom qiskit import QuantumRegister, ClassicalRegister, QuantumCircuitimport warnings #忽略告警warnings.filterwarnings('ignore')#定义量子傅里叶变换函数qftdef qft(circ, q, n): """n-qubit QFT on q...

2019-10-30 22:15:16 1523

原创 Markdown \\ 和 &让长公式对齐及换行

&相当于制表符a=b+cd+e=f\begin{aligned} &a=b+c \\ d+e&=f\end{aligned}d+e​a=b+c=f​

2019-10-30 21:50:37 6074

原创 IDEA给项目或者模块引入jar包

2019-10-30 15:54:52 1333

原创 论文查找网站

https://www.researchgate.net/publication/330933710_A_Review_on_Relations_Extraction_in_Police_Reports/link/5c5c32a792851c48a9c16614/download

2019-10-30 14:34:45 905

原创 python对负数立方报错解决先把符号提出来

s=1N∑(pix−E)33s=\sqrt[3]{\frac{1}{N} \sum(p i x-E)^{3}}s=3N1​∑(pix−E)3​np.sign(((b_d-b1)**3).mean())#符号提取np.sign(((b_d-b1)**3).mean())*abs(((b_d-b1)**3).mean())**(1/3)#abs后面直接取绝对值...

2019-10-28 15:55:36 485

原创 RuntimeError: incompatible native format - size of long 解决 pyltp 的pisrl.model 在windows系统下不可用

下载这个把pisrl.model替换掉http://model.scir.yunfutech.com/server/3.4.0/pisrl_win.model参考:https://blog.csdn.net/qq_22521211/article/details/84029904

2019-10-28 13:48:25 1754

原创 pyltp linux 安装记录

上来就报错gcc: error trying to exec 'cc1plus': execvp: 没有那个文件或目录解决:yum install -y gcc-c++

2019-10-28 13:43:36 563

原创 cmd命令行只能进c盘解决

pushd d:\

2019-10-27 12:08:47 3019 1

转载 Python——numpy排序(sort、argsort、lexsort、partition、sorted)

https://blog.csdn.net/Haiyang_Duan/article/details/79221458

2019-10-25 14:51:17 403

原创 大文本大文件打开工具

大文件excel 什么的一打开就废了可以用logviewUltraeditnotepad++subline也还行

2019-10-25 14:14:28 3504

原创 No module named 'pyecharts.faker'

from pyecharts.faker import Faker改成from example.commons import Fakerpyecharts新版接口改了

2019-10-25 11:12:00 8680 3

原创 多项式朴素贝叶斯算法,Multinomial Naive Bayes 的 mx.coef_问题

def mx_bayes(train_x, train_y): mx = MultinomialNB(alpha=0.01) mx.fit(train_x, train_y) return mxmx= mx_bayes(x_train,y_train)mx.score(x_test,y_test)mx.coef_mx.coef_中数组代表什么啊官网说是多项式的线...

2019-10-25 01:13:21 2090

原创 西瓜书《机器学习》中机器学习的可解释性总结

1显然,分类边界的每一段都是与坐标轴平行的这样的分类边界使得学习结果有较好的可解释性2神经网络是一种难解释的"黑箱模型",但已有一些工作尝试改善神经网络的可解释性,主要途径是从神经网络中抽取易于理解的符号规则,百 参阅[Tickle et al., 1998; Zhou, 2004]3贝叶斯网为不确定学习和推断提供了基本框架,因其强大的表示能力、良好的可解释性而广受关注 ...

2019-10-25 01:08:25 455

转载 多项式拟合研究

python中利用numpy求解多项式以及多项式拟合:https://blog.csdn.net/tanlangqie/article/details/86473480https://scikit-learn.org/stable/modules/linear_model.html#polynomial-regression-extending-linear-models-with-basis...

2019-10-25 00:28:22 295

转载 ModuleNotFoundError: No module named 'sklearn.grid_search

https://blog.csdn.net/u012852847/article/details/84639213

2019-10-24 22:07:08 533

原创 ModuleNotFoundError: No module named 'sklearn.grid_search'

# from sklearn.cross_validation import train_test_split改成# from sklearn.cross_validation import train_test_splitsklearn.cross_validation不再使用

2019-10-24 22:04:44 621 1

转载 Hbase出现ERROR: Can't get master address from ZooKeeper; znode data == null解决办法

https://www.cnblogs.com/zlslch/p/6556870.html

2019-10-22 21:35:55 453

转载 Colab

https://www.jianshu.com/p/000d2a9d36a0

2019-10-22 15:51:02 2348

原创 关联规则的支持度,置信度,提升度

支持度支持度是个百分比,它指的是某个商品组合出现的次数与总次数之间的比例。支持度越高,代表这个组合出现的频率越大。置信度它指的就是当你购买了商品A,会有多大的概率购买商品B,所以说置信度是个条件概念,就是说在A发生的情况下,B发生的概率是多少。提升度商品推荐重点考虑的是提升度,因为提升度代表的是“商品A的出现,对商品B的出现概率提升的”程度。...

2019-10-21 14:35:48 4823

原创 关联规则计算步骤 Apriori算法计算及算法复杂度分析

定义1 项目与项集, 设:1={i 1, i2,…, i m}是m个不同项目的集合,每个 ik(k=l , 2 , … , m)柏:为一个项目。tem)。, 项目的集合 I 称为项目集合。temset) ,简称为项 靠。真元素个数称为顶集的长度,长度为k的项集 称为k-项集(k-:ltemset)。定义2 交易 · 每笔交易T(Tran saction )是项集1上的一个子集, 即T...

2019-10-21 14:31:47 4796

原创 关联规则与强关联规则计算

关联规则的支持度对于关联规则R: X=Y,其中Xcl, Ycl,并且XnY=φ。规则R的的支持度(Support)是交易集中同时包含X和Y的交易数与所有交易数之比。 support (X⇒Y)=count⁡(X∪Y)∣D∣\text { support }(X \Rightarrow Y)=\frac{\operatorname{count}(X \cup Y)}...

2019-10-21 13:04:02 16648 1

转载 neo4j节点和关系分开创建有性能问题

https://markhneedham.com/blog/2014/10/23/neo4j-cypher-avoiding-the-eager/

2019-10-21 11:52:13 417

原创 neo4j常用命令

导入数据LOAD CSV WITH HEADERS FROM "file:///person1.csv" AS rowcreate (n:Person1{name:row.name,type:row.sex})创建关系:create (n:Person1{name:"王志侑"})-[:loves]->(m:Person1{name:"陈怡君"})按照关系查询:MATCH p=(...

2019-10-20 23:01:21 1328

原创 Starting Neo4j failed: 'org.neo4j.server.' was initialized, but failed to start.解决

Starting Neo4j failed: Component 'org.neo4j.server.database.LifecycleManagingDatabase@6140c6d6' was successfully initialized, but failed to start. Please see attached cause exception.

2019-10-20 22:01:41 2671

原创 txt用navicat导入mysql要重命名一下csv在excel中另存为csv再导入不会报错

txt导入mysql要重命名一下csv在excel中另存为csv再导入不会报错

2019-10-20 20:24:48 174

转载 UpgradeNotAllowedByConfigurationException: Failed to start Neo4j with an older data store version.

https://blog.csdn.net/qq_21383435/article/details/79567395

2019-10-19 14:22:42 233

转载 centos7精简安装后,使用中发现没有killall命令。 安装这个包即可: yum install psmisc

https://www.cnblogs.com/rzxiaojia/p/6510780.html

2019-10-19 10:26:42 2328

原创 neo4j启动报错 CategoryInfo : NotSpecified: (:) [Write-Error], WriteErrorException

2019-10-19 09:01:46 2729 5

原创 deepdive安装报错 curl: (7) Failed connect to raw.githubusercontent.com:443; Connection refused

curl: (7) Failed connect to raw.githubusercontent.com:443; Connection refused

2019-10-19 00:27:47 895 1

原创 centos ping git.io可以通为什么curl -v git.io不通?

ping git.io可以通为什么curl -v git.io不通?

2019-10-19 00:25:54 715

原创 使用dos的tree命令输出文件夹树

tree /f H:\Self-studyMaterials\ >D:\dirlist.txt参考https://www.cnblogs.com/dkplus/p/8487330.html

2019-10-19 00:02:51 323

原创 centos 安装python3

yum -y install python3

2019-10-18 10:53:13 79

转载 centos 更换yum源

https://www.cnblogs.com/mmdln/p/9039158.html

2019-10-18 10:51:57 160

原创 Deepdive 只能在linux下运行

Deepdive 只能在linux下运行

2019-10-17 17:02:10 546

原创 决策树ID3算法之经典鸢尾花分类

from sklearn.datasets import load_irisfrom sklearn.tree import DecisionTreeClassifieriris=load_iris()modle=DecisionTreeClassifier(criterion='entropy')from sklearn.model_selection import cross_val_...

2019-10-15 20:55:14 3525

原创 Linux的7个终端

inux有7个终端f1 ~ f7 7个终端,f1是图形化界面

2019-10-13 14:14:54 3711

原创 VMware Workstation Pro的三种ip分配方式

桥接linux通过桥接的方式上网,也就是相当于多了一个网线当ip地址不够的话,就会出现ip冲突的问题nat交换机多分配一个地址仅主机host-only你的linux只能和你自己的windows相同,其他人都无法访问...

2019-10-13 14:11:56 829 1

原创 LTP官网

http://ltp.ai/download.html

2019-10-13 12:54:17 950

原创 python 弃windows10从Linux

windows10对有些python模块的安装我真是够了window10的编译系统和Linux没法比

2019-10-13 09:49:00 113

原创 在用 pip 安装 tensorflow 时会自动卸载现有的版本

2019-10-13 00:26:38 641 1

大数据开发各基础组件(Linux)

apache-hive-2.1.1-bin.tar.gz hadoop-2.7.3.tar.gz hbase-1.2.4-bin.tar.gz jdk-8u171-linux-x64.tar.gz zookeeper-3.4.10.tar.gz

2019-02-03

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除