自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

、Lu的博客

在每天重复的习惯里,不断地遇见美好。

  • 博客(62)
  • 资源 (2)
  • 收藏
  • 关注

原创 Ubuntu18.04配置ssh服务以实现远程连接

1.连接环境虚拟机:Ubuntu18.04连接工具:SecureCRT2.配置虚拟机的SSH服务sudo apt-get updatesudo apt-get install openssh-clientsudo apt-get install openssh-serversudo service ssh start经过上面几步之后,SSH已经基本安装成功,现在查看是否安装成功:sudo ps -e | grep ssh如果能看到第二行sshd,则证明安装成功!

2021-04-07 09:38:33 3683 7

原创 解决jupyter notebook无法找到虚拟环境的问题

我个人用的是anaconda3的一个python集成环境,自带jupyter notebook,但在我打开jupyter notebook界面后,却找不到对应的虚拟环境,原来是jupyter notebook只是通用于下载anaconda时自带的环境,其他环境要想使用必须手动下载一些库:1.首先进入到自己创建的虚拟环境(pytorch是虚拟环境的名字)activate pytorch2.在该环境下下载这个库conda install ipykernelconda install nb_

2020-08-16 18:00:13 13893 16

原创 scrapy手工识别验证码登录超星泛雅

我这两天一直都在学习scrapy如何保持会话状态,在网上找了好多的资料以及博主的文章,做了一点总结。这里,以超星网课登录系统作为例子讲解:1. 首先肯定是找到登录时需要提交的post表单数据,最快的办法就是查看页面源代码或者F12找出对应的form表单里面的action,如果查看的action是空值,也就是js加载的,我们则需要在网络中找出对应的提交链接请求。经过登录测试和分析,登录的url为“https://passport2.chaoxing.com/login”,并且请求方法为post,也

2020-07-13 00:19:30 1802

原创 解决:elcipse启动tomcat时 子容器启动失败问题

解决:七月 04, 2020 7:49:12 下午 org.apache.catalina.startup.VersionLoggerListener log信息: Server.服务器版本: Apache Tomcat/7.0.100七月 04, 2020 7:49:12 下午 org.apache.catalina.startup.VersionLoggerListener log信息: 服务器构建: Feb 11 2020 08:31:12 UTC七月 04,...

2020-07-04 19:55:24 10765

原创 查看页面源代码和F12(检查)的区别

查看源代码:就是别人服务器发送到浏览器的原封不动的代码,也就是最原始的代码。(F12)检查元素:看到的就是最终的html代码。即:源代码 + 网页js渲染 。【注】在源代码中找不到的代码,是在浏览器执行js动态生成的。当我们在爬虫时需要对js在加载的数据进行爬取时,就不能像普通爬虫一样进行获取了,这时通常有两种方法:1. 通过selenum自动化技术2. 通过在页面上进行抓包,获取js链接以及表单元素进行请求...

2020-07-04 17:19:47 10336

原创 xpath语法及其使用教程

一. XPATH1. 什么是xpath?xpath(XML Path Language)是一门在XML和HTML文档中查找信息的语言,可用来在XML和HTML文档中对元素和属性进行遍历。2. 常用的xpath开发工具(1)Chrome插件XPath Helper(推荐使用)。(2)Firefox插件Try XPath。3. xpath语法(核心)(1) 选取节点:XPath 使用路径表达式来选取 XML 文档中的节点或者节点集。这些路径表达式和我们在常规的电脑文件系统中看到的..

2020-07-02 11:41:14 10549

原创 正则表达式的核心教程

1. 什么是正则表达式?正则表达式:按照一定的规则,从某个字符串中匹配出想要的数据,这个规则就是正则表达式。2. 正则表达式字符匹配规则(1) (字符串)匹配任意字符串text = 'hello'ret = re.match('he',text)print(ret.group())>> he(2) (.)匹配单个字符,但是不能匹配不到换行符。text = "ab"ret = re.match('.',text)print(ret.group())>&

2020-07-02 01:54:24 9042 1

原创 利用requests库、beautifulsoup、pyecharts爬取中国天气网并且进行可视化

1.安装环境(1) requests库(负责数据爬取):pip install requests(2) beautifulsoup(负责数据解析):pip install bs4(3) pyecharts(负责数据可视化): pip install pyecharts【补充】pyecharts在github上的仓库地址为:https://github.com/pyecharts/pyecharts ,需要的可以自行去学习,很容易上手。以安装以上环境的可忽略2.爬虫代码# .

2020-07-01 18:09:48 8563 1

原创 在Ubuntu上部署Jar包

1.查看端口使用情况netstat -nlp|grep8888若显示进程,则杀死进程 :kill 88882.利用传输工具将Jar传送到服务器上cd jar包所在目录# 核心语句,运行jar包nohup java -jar jar包 &不断输入端口查询命令 netstat -nlp|grep8888,若出现进程,则jar包部署成功:...

2021-05-11 09:37:44 1695

原创 事务

1、事务的四大特性(ACID)1.原子性(atomicity):事务中所有操作是不可再分割的原子单位。事务中所有操作要么全么执行成功,要么全部执行失败。2.一致性(consistency):事务执行后,数据库状态与其他业务规则保持一致。例如转账业务,无论事务执行成功与否,参与转账的两个账号余额之和不变。3.隔离性(isolation):隔离性是指在并发操作中,不同的事务应该隔离开来,是每个并发的事务之间不会相互干扰。4.持久性(durability):一旦事务提交成功,事务的所有数据库操作

2021-04-20 11:07:03 312

原创 JDBC(java database connectivity)

一、代码展示(简洁版+规范版)import java.sql.Connection;import java.sql.DriverManager;import java.sql.ResultSet;import java.sql.Statement;/** * JDBC简洁写法 */public class Jdbc { // 四大参数 public static final String driverClassName = "com.mysql.jdbc.Driver";

2021-04-17 11:08:11 236

原创 数据库约束

约束:约束是添加在 列 上的,用来约束列。一、主键约束 primary key(~)当表的某一列被指定为主键之后,该列就不能为空,不能有重复值出现,这样主键才能唯一标识一条记录。1.主键的三个特性:a.非空 b.唯一 c.被引用(被外键引用时)2.创建表时指定主键的两种方式://方式一:create table 表名( id int(11) primary key,);//方式二:create table 表名( id int(11);

2021-04-13 09:10:28 1446

原创 MySQL备份与恢复数据库

备份: 数据库----->sql语句恢复:sql语句----->数据库1.备份:数据库导出SQL脚本mysql -u用户名 -p密码 数据库名>生成的.sql存储路径【例如】mysqldump -uroot -proot jianshu>D:\jianshu.sql【注】生成的.sql文件并不包含create database 语句2.备份:数据库执行SQL脚本mysql -uroot -proot -hlocalhostdrop database.

2021-04-12 21:19:12 163

原创 SQL语句大全(DDL+DML+DQL+DCL)

一.DDL(数据定义语言:用于定义和管理 SQL 数据库中的所有对象)1.DDL_数据库(1)查看所有数据库 show databases;(2)选择、切换数据库 use 数据库名;(3)创建数据库 create database (if not exists) 数据库名 (charset=utf8);(4)删除数据库 drop dabatase (if exists) 数据库名;(5)修改数据库编码 alter database 数据库名 char

2021-04-12 20:29:32 438

原创 解决MySQL在命令行操作时的编码问题

1.查看MySQL数据库编码mysql -u用户名 -p密码show variables like 'char%';2.编码解释1.character_set_client:MySQL会使用该编码来解读客户端发送来的数据,如果该字段编码为utf8,那么如果客户端发送过来的数据不是utf8,就会出现乱码现象。2.character_set_results:MySQL会把数据转换成该编码后,再发送给客户端,例如该编码为utf8,那么如果客户端不使用utf8来解读,那么就会出现乱码现象。

2021-04-12 20:27:23 254

原创 SQL语言

一.DDL(数据定义语言:用于定义和管理 SQL 数据库中的所有对象)四.DQL(数据查询语言:对表中的数据进行查询)(数据操作语言:对表记录的操作(增删改)):是一种可对数据访问权进行控制的指令)1.DQL_单表查询。2.DQL_多表查询。

2021-04-09 16:09:06 79

原创 如何将爬虫爬下来的json文件格式化为标准json格式

1.首先我们先看一下爬下来的格式(当然有些方式爬下来的格式直接就是标准的,不需要修改)可以看到,一行就是一个json对象,但是可阅读性太差,当我们用json在线编辑器阅读时,发现会报错(json格式不对),那是因为单纯地按一行来讲的话,每一行都是一个json对象是没什么问题的,但是我们整个文件有多个对象,当我们复制到json在线编辑器想整体查看时就会出问题了,那我们要做的就是将多个对象放到一个数组里面[{obj},{obj}, ... {obj}],所以我们需要做的就是在每一个对象后添加,分隔符,并

2021-04-08 16:08:40 1060

原创 Ubuntu18.04安装MySQL5.7

1.环境安装,遇到需要输入"YES"的输入YES即可# 安装mysql服务端sudo apt-get install mysql-server# 安装mysql客户端sudo apt install mysql-client# 安装mysql相关依赖sudo apt install libmysqlclient-dev# 检查mysql当前状态sudo netstat -tap | grep mysql2.修改密码,我的账号密码都是root,按需更改// 命

2021-04-07 15:20:47 371 2

原创 Ubuntu18.04安装JDK1.8

1.去Oracle下载对应操作系统以及对应JDK版本的Jdkhttps://www.oracle.com/java/technologies/javase/javase-jdk8-downloads.html2.使用传输工具(我用的filezilla)将压缩包上传到服务器上,并且解压缩tar -zxvf jdk-8u281-linux-x64.tar.gz解压缩完成后,会出现jdk文件夹:3.更改文件名,方便使用sudo mv jdk1.8.0_281 /usr/mys

2021-04-06 20:19:07 223 3

原创 Java复习遗忘知识点

1.实例化对象的内存问题堆内存:保存的是对象的具体些信息,在程序之中堆内存空间的开辟是通过"new"完成的。栈内存:保存的是一块堆内存(对象)的地址,即通过地址找到堆内存,而后找到对象内容。...

2021-03-29 18:07:18 947 4

原创 nn.调用各种模型层 详解

1.通俗讲解pytorch中nn.Embedding原理及使用 :通俗讲解pytorch中nn.Embedding原理及使用 - 简书 (jianshu.com)

2020-11-22 19:47:02 416

转载 BILSTM-CRF

本文框架如下:介绍——在命名实体识别任务中,BiLSTM模型中CRF层的通用思想详细的实例——通过实例来一步步展示CRF的工作原理实现——CRF层的一步步实现过程谁可以读本文——本文适用与NLP初级入门者或者AI其他相关领域需要有的基础知识:你只需要知道什么是命名实体识别,如果你不懂神经网络,条件随机场(CRF)或者其它相关知识,不必担心,本文将向你展示CRF层是如何工作的。本文将尽可能的讲的通俗易懂。1.介绍 基于神经网络的方法,在命名实体识别任务中非常流行和普遍...

2020-11-22 18:24:10 1185 1

转载 深度学习解决过拟合的几种常用方法

什么是过拟合?  我们都知道,在进行数据挖掘或者机器学习模型建立的时候,因为在统计学习中,假设数据满足独立同分布(i.i.d,independently and identically distributed),即当前已产生的数据可以对未来的数据进行推测与模拟,因此都是使用历史数据建立模型,即使用已经产生的数据去训练,然后使用该模型去拟合未来的数据。但是一般独立同分布的假设往往不成立,即数据的分布可能会发生变化(distribution drift),并且可能当前的数据量过少,不足以对整个数据集进行分布

2020-10-18 16:13:24 5890

原创 anaconda安装scrapy(其他库类似)时提示权限拒绝permission deny

解决方法(例如): 原命令:pip install scrapy 现命令:pip install --user scrapy成功解决!~

2020-10-16 11:34:37 216

转载 吴恩达机器学习_第三章_线性代数知识回顾

三、线性代数回顾(Linear Algebra Review)

2020-08-26 09:08:54 107 1

转载 吴恩达机器学习_第二章_单变量线性回归

二、单变量线性回归(Linear Regression with One Variable)2.1 模型表示参考视频: 2 - 1 - Model Representation (8 min).mkv我们的第一个学习算法是线性回归算法。在这段视频中,你会看到这个算法的概况,更重要的是你将会了解监督学习过程完整的流程。让我们通过一个例子来开始:这个例子是预测住房价格的,我们要使用一个数据集,数据集包含俄勒冈州波特兰市的住房价格。在这里,我要根据不同房屋尺寸所售出的价格,画出我的数据集。比方说,

2020-08-26 09:03:02 229

转载 吴恩达机器学习_第一章_引言

引言(Introduction)1.1 欢迎第一个视频主要讲了什么是机器学习,机器学习能做些什么事情。机器学习是目前信息技术中最激动人心的方向之一。在这门课中,你将学习到这门技术的前沿,并可以自己实现学习机器学习的算法。你或许每天都在不知不觉中使用了机器学习的算法每次,你打开谷歌、必应搜索到你需要的内容,正是因为他们有良好的学习算法。谷歌和微软实现了学习算法来排行网页每次,你用Facebook或苹果的图片分类程序他能认出你朋友的照片,这也是机器学习。每次您阅读您的电子邮件垃圾邮件筛选器,可以

2020-08-26 09:00:33 311

转载 机器学习第一章:简介和概括

机器学习 概述机器学习(Machine Learning,ML)是使用计算机来彰显数据背后的真实含义,它为了把无序的数据转换成有用的信息。是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。 它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。海量的数据 获取有用的信息机器学习 研究..

2020-08-19 20:19:22 1106

原创 jupyter notebook修改默认工作空间

1.打开anaconda prompt,并且输入下行命令: jupyter notebook --generate-config结果如下:2.记录下生成的.py文件,并且前去相应的目录打开:3.在打开的文件搜索“notebook_dir”,并且修改该属性,填入自己自定义的workspace path:一定不要忘了去除该行的“#”号,不然就注释掉了,相当于没改。4.更改Jupyter Notebook快捷方式的"目标"属性打开jupyter notebook快捷方式所

2020-08-16 22:47:41 278

原创 windows通过anaconda3安装pytorch教程

1. 创建一个用来下载pytorch的虚拟环境# 1.pytorch是环境名称,3.6是python版本号conda create -n pytorch python=3.6# 2.激活并切换到该环境activate pytorch# 3.现在我们就可以通过 pip list 或者 conda list 查看我们当前环境下有哪些包或者是库conda list2. 查看个人计算机的CUDA版本# 打开cmd命令行,输入以下命令:nvidia-smi如图我的版本是10.1:

2020-08-16 16:22:48 474

原创 Ubuntu18.04裸机开始配置机器学习环境

1.解决ifconfig无法查看ip问题sudo apt install net-tools2.更换下载源问题(通过图形化界面修改)在左下角菜单界面找到"软件和更新",更换"下载自"为阿里云的源即可,关闭之后系统提示重新载入同意即可。3.解决ubuntu18.04无法全屏展示问题sudo apt-get updatesudo apt-get install open-vm-toolssudo apt-get install open-vm-tools-desktop4.输入pytho.

2020-08-16 10:44:20 196

原创 解决Ubuntu18.04不能全屏问题

1.更新下载源,在这里用的是 http://mirrors.aliyun.com/ubuntu 阿里云的服务器。sudo apt-get update2.安装open -vm-tools、open-vm-tools-desktopsudo apt-get install open-vm-toolssudo apt-get install open-vm-tools-desktop3.点击全屏...

2020-08-15 11:51:41 1670

转载 爬虫之利用selenium处理滚动条

转载于:https://zhuanlan.zhihu.com/p/159566623 在我们爬取页面时,当页面上的元素超过一屏后,想操作屏幕下方的元素,是不能直接定位到,会报元素不可见的。这时候需要借助滚动条来拖动屏幕,使被操作的元素显示在当前的屏幕上。滚动条是无法直接用定位工具来定位的。selenium里面也没有直接的方法去控制滚动条,这时候只能借助J了,还好selenium提供了一个操作js的方法:execute_script(),可以直接执行js的脚本。一. 控制滚动条高度1.1滚动...

2020-07-23 22:15:17 361

转载 人工智能、机器学习、深度学习之间的关系

人工智能的浪潮正在席卷全球,诸多词汇时刻萦绕在我们耳边:人工智能(Artificial Intelligence)、机器学习(Machine Learning)、深度学习(Deep Learning)。不少人对这些高频词汇的含义及其背后的关系总是似懂非懂、一知半解。为了帮助大家更好地理解人工智能,这篇文章用最简单的语言解释了这些词汇的含义,理清它们之间的关系,希望对刚入门的同行有所帮助。人工智能:从概念提出到走向繁荣1956年,几个计算机科学家相聚在达特茅斯会议,提出了“人工智能”的概念,梦

2020-07-15 20:53:30 1353

原创 虚拟机克隆以及网络配置教程

一. 虚拟机克隆(以CentOS6.5为例)(1) 选中想要克隆的机器后点击右键,点击快照中的拍摄快照,填入快照名称以及快照描述,再点击拍摄快照至此快照便拍摄完成了。如下图(非重点):(2) 选中想要克隆的机器后点击右键,点击管理中的克隆,如下图:(3) 点击下一步,并且选中 现有快照,并且选择自己刚才拍摄的快照:(4) 点击下一步,并且选择克隆的模式(我是单纯的用来做测试,所以我选的链接克隆),具体区别请看:https://zhidao.baidu.com/question/1

2020-07-15 17:14:56 1512

原创 pip升级版本后pip install时出现:ModuleNotFoundError: No module named ‘pip._internal‘

这是版本冲突造成的,我们需要找到对应的pip文件,我的目录位于/usr/bin/pip,我们下需要vim/usr/bin/pip后(每个人的pip文件位置可能不同),将from pip._internal import main 注释掉,改成from pip import main 保存退出就好了(使用vim 时, 在命令行里 输入 vim 指定路径/pip打开文件,进入之后先按i键进入插入模式,更改完成后先按ESC,然后再输入:wq即可保存退出)...

2020-07-15 14:14:27 779

原创 pip下载时出现Could not find a version that satisfies the requirement ~

我是在CentOS6.5安装scrapy框架时候出现:这是python国内网络的问题,这时我们需要用国内的镜像源来加速。解决方案:pip install 包名 -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com(1)http://pypi.douban.com/simple/:这是豆瓣源(2)--trusted-host pypi.douban.com :这是为了获得ssl证书的认证,不然会报错示例.

2020-07-15 14:07:14 671 2

原创 yum安装时出现:Cannot retrieve metalink for repository: epel. Please verify its path and try again

解决方案 :cd /etc/yum.repos.d/epel.repo把baseurl那一行取消注释把mirrorlist那一行加上注释打开/etc/yum.repos.d/epel.repo,将[epel] name=ExtraPackagesforEnterpriseLinux6-$basearch #baseurl=http://download.fedoraproject.org/pub/epel/6/$basearch mirrorlist=https://m...

2020-07-15 11:46:40 777

原创 CentOS6.5安装python3.6教程

1. 安装源码编译器等工具yum -y install gcc gcc-c++ autoconf automake make zlib zlib-devel2.下载Python安装包(linux版本)地址:https://www.python.org/ftp/python/3.6.0/Python-3.6.0.tgz3. 通过ssh传输工具将安装包传输到虚拟机后,以root权限打开终端,进入安装包的存放路径,并且解压:tar -xzvf Python-3.6.0.tgz ..

2020-07-15 01:43:57 387

原创 requests库爬虫模拟登录的三种方式

方式一. 实例化session,使用session发送post请求进行提交表单数据模拟登录,再利用该session请求登录后才能访问的页面。注: 必须是同一个session,这也才能保持会话状态。方式二. 在请求头headers里面添加Cookie键,值为cookie字符串,字符串内容即 在浏览器手动登录完成后F12 查看对应的Cookie字符串。方式三. 在请求方法里添加cookies参数,字段值为字典形式的Cookie。注: 方式二和方式三 最大的区别就是,一个是字符串形式,一个是字典形

2020-07-13 11:35:35 391

Ubuntu WEB服务器环境搭建.docx

服务器环境搭建.docx

2021-05-11

zgtqw_pyecharts.py

# 爬取中国 天气网 并进行 pyecharts数据可视化 # requests + beautifulsoup + pyecharts (1) requests库(负责数据爬取):pip install requests (2) beautifulsoup(负责数据解析):pip install bs4 (3) pyecharts(负责数据可视化): pip install pyecharts

2020-07-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除