Ayrton1031-CSDN博客

原创 python数据挖掘03——Pandas

pandas集合了numpy与matplotlib，在数据处理能力上更具有便捷性，读取数据文件较方便。DataFrame：pandas中的结构，可以看作带有行索引和列索引的二维表结构。行对应index，列对应columns。import pandas as pdimport numpy as npstock_change = np.random.normal(0,1,s...

2019-12-11 18:14:54 186

原创 python数据挖掘02——Numpy

Numpy支持大量维度数组与矩阵的运算，提供大量的数学函数库。Ndarray:ndarray是一个存放多个相同元素类型的多维数组，且每个元素都有相同的大小区域，它们之间是连续存储的。1、ndarray.array():创建一个ndarray数组。a = np.array([[1,2,3],[4,5,6],[7,8,9]])2、ndarray.ndmin:维度，...

2019-12-10 20:59:41 272

原创 python数据挖掘01——Matplotlib

Jupyter notebook:是一个在web应用程序，相当于网页版的python IDE。1、快捷方式：Shift+Enter : 运行本单元，选中下个单元 Ctrl+Enter : 运行本单元 A ：在上方插入新单元 B：在下方插入新单元 DD：删除该行 Ctrl+鼠标：多光标操作Matplotlib:用于开发二维图表的可视化工具。1、快速入门：...

2019-12-10 17:02:49 193

原创 Java基础——文件操作

File类：文件和目录路径名的抽象表示，主要用于文件和目录的创建，查找与删除操作。无论该路径下是否存在文件或目录，都不影响File对象的创建。路径不区分大小写 // 构造方法创建文件对象 String file1 = "d:\\a.txt"; File f1 = new File(file1); // 构造方法可以支持父路径名与子路径名拼接的方...

2019-11-27 21:23:43 330

原创 Neo4j学习之路05——Java嵌入开发

Java开发人员可以在java代码中调用Neo4j的API，并且将操作嵌入在Java代码中。一、基本操作：创建maven工程并添加neo4j的依赖关系 <dependency> <groupId>org.neo4j</groupId> <artifactId>neo4j&...

2019-10-29 19:30:54 531

原创 Neo4j学习之路04——高级操作

索引：使用CREATE INDEX ON可以在拥有某个标签的所有节点的某个属性上创建索引，由于在后台创建，索引并不能立即生效。// 在所有拥有Person标签的所有节点的name属性上创建索引CREATE INDEX ON ：Person(name)// 删除索引DROP INDEX ON :Person(name)索引在查询语句中会被自动使用约束：neo4...

2019-10-28 15:37:47 514

原创 Neo4j学习之路03——函数

Cypher函数分类：断言函数标量函数列表函数数学函数字符串函数断言函数：对给定的输入返回true或false的布尔函数，主要用于查询WHERE的部分过滤子图ALL：判断一个断言是否适用于列表中的所有元素// 返回路径中的所有结点都有一个至少大于30的age属性MATCH p = (a)-[*1..3]->(b)WHERE a.name = 'Al...

2019-10-26 15:58:58 1069

原创 Neo4j学习之路02——Cypher语法

MERGE：合并节点，若没有匹配到查询的模式就创建它1.1：合并节点：MERGE创建节点使用唯一性约束，使节点属性不发生重名的情况// 合并有多个属性的节点，若不存在则创建MERGE (charlie {name:'Charlie Sheen', age:10}) RETURN charlie1.2：MERGE与MATCH与CREATE搭配：// 查询找到带有Pers...

2019-10-26 10:38:01 615

原创 Neo4j学习之路01——快速入门

什么是Neo4j?Neo4j是一个由Java编写的高性能图数据库，它将结构化的数据存在网络上而不是表中。在关系型数据库中，我们表示多对多的关系需要一张中间表连接，当关系变得复杂时，就需要多张中间表，这样便使得数据表间关系复杂且耦合性强，不易维护修改。为了提供用于遍历大量数据的适当性能，应运而生出了图数据库。数据模型：每个数据抽象成对象用一个圆圈结点来表示，属性...

2019-10-23 10:26:05 327

原创我的爬虫学习之旅 (八) 爬虫实战之京东商品评论爬取

前言：本次针对待爬取数据是由动态网页技术加载出的情形进行分析，在之前的实战案例中，爬取的数据内容都是随着URL变化来实现页面的跳转，而动态加载的形式使得我们原本可以在页面上看到的内容却在源码中找不到。这时，就需要使用另一种分析页面的方式进行爬虫的编写。实战案例：爬取京东商品的用户评论首先打开京东，进入某一指定商品页面，本次选择华为P30的商品信息页面链接地址：https...

2019-04-29 03:51:37 3972 5

原创我的爬虫学习之旅 (七) 爬虫实战之微博评论爬取

前言：由于在学习python的过程中对数据库的相关内容没有接触，所以本次结合爬虫与数据库来做这一方面的补充学习。对于python数据库的学习使用PyMySql，PyMySQL 是在 Python3.x 版本中用于连接 MySQL 服务器的一个库，Python2中则使用mysqldb。一、pymysql快速入门：创建数据库链接对象使用数据库连接对象创建游标对象使用游标对...

2019-04-28 18:37:11 1711 1

转载我的爬虫学习之旅 (六) BeautifulSoup

前言：BeautifulSoup：美味的汤。是一个强大又方便的python网页解析库，可以从网页里HTML或XML文件中提取数据。Beautiful Soup自动将输入文档转换为Unicode编码，输出文档转换为utf-8编码。一、简单入门：首先导入BeautifulSoup这个库，若报错则需要在命令行中安装这个库。from bs4 import BeautifulSoup...

2019-04-27 19:07:34 630

转载我的爬虫学习之旅 (五) Xpath初识

前言XPath是一种XML路径语言，适合于对HTML中的标签进行搜索。虽然学习过正则表达式，但是XPath的功能以及效率要比正则表达式方便的多，在python中要使用XPath，需要安装lxml库，lxml库是Python的一个解析库，支持HTML和XML的解析，支持XPath。pip install lxml一、XPath基础使用：例如针对如下的一段html文本：...

2019-04-26 21:40:26 436

原创我的爬虫学习之旅 (四) 爬虫实战之猫眼电影TOP100

前言在学习了对网页的基本请求方式以及正则匹配的规则后，可以用现掌握的理论做一些简单的爬虫脚本，本次的目标站点是猫眼电影的TOP100。首先我们来到猫眼电影的首页，进入开发者模式，然后分析它的URL。然后我们点击翻页，发现它的URL变化如下：https://maoyan.com/board/4?offset=0 #第一页https://maoyan.com/board...

2019-04-26 15:47:59 502

原创我的爬虫学习之旅 (三) 正则表达式

正则表达式正则表达式是对字符串操作的一种逻辑公式，就是用事先定义好的一些特定字符、及这些特定字符的组合，组成一个“规则字符串”，这个“规则字符串”用来表达对字符串的一种过滤逻辑。用大白话来讲，正则表达式是一种匹配模式，能够从目标文本内容中匹配到预定义的字串序列。关于正则表达式的语法以及学习可以在B站中查看有关视频教程，在这里推荐这篇文字教程：正则表达式30分钟入门教程当然，正则表达...

2019-04-26 01:48:32 184

原创我的爬虫学习之旅 (二) Requests库

前言网上的多数教程都是先基于urllib这个库开始介绍爬虫的，然而当你学习了一段时间后，就会发现urllib这个库使用起来其实并不方便，多数的代码也是不使用这个库所提供的方法的。所以，对于urllib库只需拥有一个简单的认识即可，可以直接从Requests这个库开始入手学习。Requests库一、基本使用：requests库是python实现的最简单易用的HTTP库，比url...

2019-04-25 23:38:21 268

原创我的爬虫学习之旅 (一) 初识爬虫

写在前面此系列文章是记录本人在学习爬虫过程中的“心路历程”，由于之前的学习没有好好的做总结，导致在一段时间后对之前所掌握的内容变得生疏。所以这次决心开始好好记录学习过程中的知识内容，以便于日后重温。本人的爬虫学习主要是参考崔庆才老师的爬虫系列课程。崔老师的课程讲解非常详细，在B站上也有配套的视频教程（建议大家自行搜索）。我推荐在学习过程中，应该及时记录崔老师课程中的相关知识点。因为...

2019-04-25 19:14:22 178

原创 VS编译中出现“This function or variable may be unsafe”的解决方法

例如： 'strcpy': This function or variable may be unsafe. Consider using strcpy_s instead. To disable deprecation, use _CRT_SECURE_NO_WARNINGS. See online help for details 这种微软的警告，主要因为那些C库的函数，很多函数...

2018-06-26 13:12:31 732

原创 Ubuntu中主机名的修改

在Linux中打开终端控制，一般显示格式为 nameA@nameB: 这里的nameA代表着目前的用户名，nameB则代表该系统的主机名。如果在这里我们想修改主机名，首先进入到/etc目录cd /etc然后执行：sudo gedit hostname接着输入用户的密码。将打开文本中的名称改为要替换的主机名，保存后重启即可。...

2018-06-19 16:03:13 193

m0_38102468的博客