自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 笔记——文件读写操作

批量读取文件:# root:目录的路径,dirs:目录下的所有文件夹,files:目录下所有文件for root, dirs, files in os.walk(path): # path为待读取的文件 print(root, dirs, files)按文件名称顺序读取文件:files=os.listdir(path)files.sort() #对读取的路径进行排序按文件名大小读...

2020-03-11 11:28:20 100

原创 python链接neo4j导入数据实例

python代码连接neo4j,导入csv数据import sysimport csvfrom py2neo import Graph, Node, Relationship # pip install py2neo# 连接neo4j数据库graph = Graph("http://localhost:7474", username="neo4j", password='123')#...

2020-05-13 17:13:38 902 3

原创 爬虫实例——html、img保存

#!/usr/bin/env python# coding: utf-8import requestsimport randomfrom lxml import etreeimport urllib.requestdef download_img(): """ # html页面保存为本地文件 # img图片保存为本地文件 """ url = ...

2020-03-25 10:35:09 69

原创 neo4j: cypher语法命令导入.csv文档数据

cypher语法导入csv数据将文件放入import目录下USING PERIODIC COMMIT :每一1000行提交一次,默认1000USING PERIODIC COMMIT 1000LOAD CSV WITH HEADERS FROM “file:///entity.csv” AS linemerge (n:entity{ID:line.ID,name:line.name,l...

2019-12-24 18:13:16 230

原创 neo4j索引的创建、删除、查看

1.查看索引::schema2.创建索引:create index on:entity(name) // entity为节点标签,name为属性索引创建中。。。索引创建完成:3.删除索引:drop index on:entity(name)...

2019-12-24 17:59:42 302

原创 笔记:jiagu.ner命名实体识别,将识别结果组合成词

**jiagu:**https://github.com/ownthink/Jiagutext = '姚明(Yao Ming),1980年9月12日出生于上海市徐汇区,祖籍江苏省苏州市吴江区震泽镇,前中国职业篮球运动员,司职中锋,现任中职联公司董事长兼总经理。'ner = jiagu.ner(text) # 命名实体识别print(len(ner), ner)i = 0while i...

2019-11-29 16:57:55 324

原创 neo4j-admin import实例:csv导入neo4j,graph.db迁移

neo4j之’neo4j-import(neo4j-admin import)实战’https://blog.csdn.net/shuibuzhaodeshiren/article/details/885593831.neo4j-admin import语法:neo4j-admin import [--mode=csv] [--database=<name>] ...

2019-11-01 14:07:51 382

转载 TextRank算法原理简析、代码实现

前言—PageRank注:PageRank原理另行查询  在介绍TextRank前,我想先给大家介绍下PageRank,实质上个人认为可以把TextRank当做PageRank2.0。  谷歌的两位创始人的佩奇和布林,借鉴了学术界评判学术论文重要性的通用方法,“那就是看论文的引用次数”。由此想到网页的重要性也可以根据这种方法来评价。于是PageRank的核心思想就诞生了:如果个网页...

2019-05-23 17:40:19 3891

原创 监督学习和无监督学习(概念)

机器学习主要解决的是两类问题,监督学习和无监督学习。掌握机器学习,主要就是学习、掌握解决这两类问题的基本思路。  解决监督学习和无监督学习的基本思路1.如何把现实场景中的问题抽象成相应的数学模型。2.如何利用数学工具对模型求解。3.根据实际问题提出评估方案,对应用的数据模型进行评估,看是否解决了实际问题。 监督学习1.什么是监督学习?  监督学习是指这么一个过程,通过外部的响...

2019-05-21 16:28:00 2773

原创 ubuntu virtualenv安装、虚拟环境的创建

1、当前已有的虚拟环境查看命令workon + enter或者workon + Tab 显示已有虚拟环境进入指定虚拟环境2、创建新的虚拟环境ps:pip list查看安装的包里有无virtualenv若无pip install virtualenv进行安装使用命令virtualenv创建环境mkvirtualenv -p python3 zidingyi(自定义环境名)或者...

2019-05-08 18:05:07 706

原创 python解析乱码ÍøÕ¾½éÉÜ,动态js查看隐藏url

解决思路:对请求到的网页内容进行编码操作后再进行解码操作url = 'http://baike.baidu.com/item/%E7%B3%96%E5%B0%BF%E7%97%85/100969'r = requests.get(url, headers=headers)r = r.text# print(r)# 对解析到的r内容r编码后再解码r = r.encode('ISO-88...

2019-05-06 22:43:03 687 2

原创 Linux常用命令

系统信息arch 显示机器的处理器架构(1)uname -m 显示机器的处理器架构(2)uname -r 显示正在使用的内核版本dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI)hdparm -i /dev/hda 罗列一个磁盘的架构特性hdparm -tT /dev/sda 在磁盘上执行测试性读取操作cat /proc/cpuinfo 显示CPU info...

2018-12-17 20:36:57 140

原创 Neo4j cypher增删查改

创建:create, 查询:(start,match), 返回结果:return删除删除结点:Match (n:City{name:‘北京’}) delete n删除关系:Match (a:Person{name:‘刘德华’})-[r:父亲]-&amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;gt;(b:Person{name:‘刘向蕙’}) delete rMatch (a:Person{name:‘刘向蕙’})-[r:女儿]-.

2018-11-22 16:21:17 561

空空如也

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除