自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 收藏
  • 关注

原创 数据结构-栈和队列

文章目录前言一、栈是什么?二、队列是什么?总结前言提示:栈和队列,严格意义上来说,也属于线性表,因为它们也都用于存储逻辑关系为“一对一”的数据。既然栈和队列都属于线性表,根据线性表分为顺序表和链表的特点,栈也可分为顺序栈和链表,队列也分为顺序队列和链队列。使用栈结构存储数据,讲究“先进后出”,即最先进栈的数据,最后出栈;使用队列存储数据,讲究“先进先出”,即最先进队列的数据,也最先出队列。一、栈是什么?栈是一种一对一的关系线性表,它的底端是封死的,增删操作只能在顶部做。数据是先进后出。它的.

2021-08-15 17:16:55 137

原创 算法解读:深度优先遍历(DFS)和广度优先遍历(BFS)

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、深度优先遍历、广度优先遍历简介?二、习题练习三、举一反三总结前言深度优先遍历(Depth First Search,简称DFS)与广度优先遍历(Breath First Search)是图论中两种非常重要的算法,生产上广泛用于拓扑排序,寻路(走迷宫),搜索引擎,爬虫等,也频繁出现在 leetcode,高频面试题中。一、深度优先遍历、广度优先遍历简介?深度优先遍历主要思路是从图中一个未访问的顶点V开始,沿着一条路一

2021-08-10 21:19:22 433

原创 动态规划算法爬楼梯

@TOC动态规划算法动态规划算法-爬楼梯题目描述假设你正在爬楼梯。需要 n 阶你才能到达楼顶。每次你可以爬 1 或 2 个台阶。你有多少种不同的方法可以爬到楼顶呢?实例1输入: 2输出: 2解释: 有两种方法可以爬到楼顶。1 阶 + 1 阶2 阶示例2输入: 3输出: 3解释: 有三种方法可以爬到楼顶。1 阶 + 1 阶 + 1 阶1 阶 + 2 阶2 阶 + 1 阶解题思路通过对题目进行分析F(1) 1F(2) 2F(3)

2021-08-03 22:17:39 179

原创 tmux命令行

1、安装apt-get install tmux2、启动tmux3、分屏$ tmux split-window$ tmux split-window -h4、移动光标#光标切换到上方窗格$ tmux select-pane -U#光标切换到下方窗格$ tmux select-pane -D#光标切换到左边窗格$ tmux select-pane -L#光标切换到右边窗格$ tmux select-pane -R...

2021-04-20 20:57:33 117

原创 GPU多机多卡

1、提交任务Dubeg模式下dgx1模式下,启动命令:cd/userhome;sh init_env.sh;二者使用镜像:torch171v32、进入debug模式的jupyter:启动ssh服务:service ssh start;检测端口222是否处于监听状态:netstat -unltp | grep ssh3、等待dgx处于运行状态,获取dgx1任务容器的ip也可以在userhome/下查找hostip.txt4、返回debug的jupyter终端,登录获取到的ipss

2021-04-20 16:57:46 308

原创 在安装python包时,遇到安装速度很慢的情况时,可以换个镜像

在这里插入代码片@TOC在安装python包时,遇到安装速度很慢的情况时,可以换个镜像。原因:默认pip是使用Python官方的源,但是由于国外官方源经常被墙,导致不可用,我们可以使用国内的python镜像源,从而解决Python安装不上库的烦恼。通过如下的命令行就能解决下载速度慢的问题,如果是下载其他的包时,只需要更换名称就好了:pip install numpy -i http://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.a

2021-04-18 16:12:19 159

原创 环境配置

环境配置1、下载安装脚本:wget linux安装地址2、给予权限chmod a+x 文件3.执行conda./conda4、激活condasour ~/.bashrc5、确认安装启动conda --version安装【pytorch】pip install torch==1.7.0安装【torchvision】pip install torchvision==0.8.0安装【tensorbo# 环境配置1、下载安装脚本:wget linux安装地址2、给予权限ch

2021-03-18 21:43:40 187

原创 知识准备

SSH:linux设备与服务器的一种协议,应用层基础上的安全协议。ssh指令:ssh -p 1111@host1111表示为用户名。shell的常见命令:cd [目录]:转换路径cd… :返回上一层目录mkdir 文件名:创建文件ls:展示所有文件rm[-r]-f[文件名] :删除文件,加[-r]可以删除文件下所有子文件,如rm[-r]-f[abc]删除abc文件夹及文件夹下的所有文件tar -xzf:[解压下载的压缩包]unzip[文件名]:解压文件cp -rpf .a/*b 将

2021-03-17 22:20:48 103

原创 多个json文件的合并

多个json文件的合并需要:多个json文件的合并分析:1、遍历json文件2、json文件处理3、创建json文件4、写入文件5、关闭 文件技术要点:1、glob2、json// An highlighted blockimport globimport jsonresult = []files = glob.glob("*.json")for f in files: with open(f,"r",encoding="utf-8") as infile: try: res

2021-03-15 22:33:52 3001

原创 json爬虫

爬虫json文件json的含义爬虫的流程总结1、对象和数组2、读取json3、输出jsonjson的含义爬虫的流程总结json,全称JavaScript object notation,也就是JavaScript对象标记,通过对象个数组的组合来表示数据,构造简洁但是结构化程度非常高,是一种轻量级的数据交换格式。1、对象和数组在 JavaScript 语言中,一切都是对象。因此,任何支持的类型都可以通过 JSON 来表示,例如字符串、数字、对象、数组等,但是对象和数组是比较特殊且常用的两种类型,下

2021-03-09 11:14:32 435 1

原创 在Ubuntu中安装pyspider框架遇到的问题

一.安装pyspiderpip install pyspider二安装中遇到的问题1"Please specify --curl-dir=/path/to/built/libcurl"解决方法:下载pycul ,pip install pycul2启动的时候出现如下错误async=True, get_object=False, no_input=False):解决方法:打开python安装目录下面的\Lib\site-packages\pyspider\run.py文件,查找所有的a

2021-01-10 16:09:49 216 1

原创 JAVA读取csv文件

package ollie1;import java.nio.charset.Charset;import java.util.ArrayList;import java.util.List;import com.csvreader.CsvReader;import edu.knowitall.ollie.OllieExtraction;import edu.knowitall.ollie.OllieExtractionInstance;import ollie1.java_ollie;

2020-12-24 22:02:02 179 1

原创 12.23日数据库的总结

删掉以Abstract开头的内容1查看以Abstract的内容的语句select*from 表名 where 列名 like’%%’;2删掉语句update 表名 set 列名=substring(列名,start,length(列名)) where 列名 like’%’;当MySQL进行更新或者删除操作时,会有这个错误提示原因是因为MySQL Workbench 默认是有一个安全更新模式,没有使用主键作为where的条件解决办法:1.执行语句手动关闭安全更新模式SET SQL_SAFE

2020-12-23 22:58:43 131

原创 MySQL数据库的常用语句

alter table “表名”add id int auto_increment primary key first; 在第一列前加id主键where email<>"" and email not like "%@%" or title like '%"' or abstract like '%"'; 检错alter table `表名` modify id varchar(24) primary key first; 将id提前并改类型为字符串,设主键alter table `表

2020-12-10 21:25:03 111

转载 Python爬虫-解析json

jsonjson指的是 JavaScript 对象表示法(JavaScript Object Notation)JSON 是轻量级的文本数据交换格式JSON 独立于语言:JSON 使用 Javascript语法来描述数据对象,但是 JSON 仍然独立于语言和平台。JSON 解析器和 JSON 库支持许多不同的编程语言。 目前非常多的动态(PHP,JSP,.NET)编程语言都支持JSON。JSON 具有自我描述性,更易理解。...

2020-12-10 20:48:59 553

原创 将csv文件导入mysql数据库中

# -*- coding: utf-8 -*-"""Spyder EditorThis is a temporary script file."""import pandas as pdfrom os import walkimport pymysqldb= pymysql.connect(host='10.24.3.3',user='penglin',password='501501',port=3306,db='web of science 1')cursor= db.cursor

2020-12-08 20:22:36 125

原创 字典排序csv

import csvimport pandas as pdimport redef main(): buf = '' # abstract_dict = {} abstract = '' ''' data_df = pd.read_csv('/home/windlbl/Documents/MagData.csv', error_bad_lines=False) data_df.head() buf = data_df.loc[0, :]

2020-12-02 15:45:48 108

原创 ubuntu中安装pycharm和idel无法安装的问题

找到iedea.vmoptions在最后添加-Dsun.tools.attach.tmp.only=true

2020-11-25 22:26:43 175

原创 从数据库中提取数据保存为json

#AMiner数据转换成JSON数据格式import fileinputimport json#待处理和处理后数据的文件路径#inputPath = 'D:/xunlei/aminer_papers_2/aminer_papers_10.txt'#outputPath = 'D:/xunlei/result/aminer_papers_10.json'#处理数据文件def format2josn(): ''' :param file: :r

2020-11-12 11:37:28 341 2

原创 MYSQL数据库的入门学习

MySQL登录命令sudo mysql -u root -pMySQL常见命令1查看当前所有的数据库show databases;2打开指定的库use 库名3查看当前库的所有表show tables;4查看其它库的所有表show tables from 库名;5创建表create table 表名(列名 列类型,列名 列类型,。。。);6查看表结构desc 表名;7查看服务器的版本MySQL version();mysql的语法规范1不区分大小写,但建议关键字大

2020-11-11 22:38:37 117

原创 如何保存两个for 循环中的局部变量

解决的方式为:下面展示一些 内联代码片。for item,items in zip(paper,paper_abstrcts):将其两个for循环放到一个for循环中就好了

2020-11-09 10:32:58 307

原创 bs4

BS4的学习bs4进行数据解析数据解析的原理:1.标签定位2.提取标签、标签属性中存储的数据值bs4数据解析的原理:1.实例化一个BeautifulSoup对象,并且将页面源码数据加载到该对象中2.通过调用BeautifulSoup对象中相关的属性或者方法进行标签定位和数据提取环境安装:pip install bs4pip install lxml(解析器)如何实例化BeautifulSoup对象下面展示一些 内联代码片。1将本地的html文档中的数据加载到该对象中fp = op

2020-11-05 20:45:57 248

原创 在使用pyspider框架沒有顯示結果的解決方法

在pyspiders爬去完畢之後,你在點擊run是不會運行的.解決方案,是停止pyspider,找到data文件下文件,除了project.db和result.db兩個文件不要刪掉之後全部刪除.data文件存放在C盤中的路徑.

2020-10-29 20:33:17 179

原创 Linux中搜狗的輸入不出中文

Linux中搜狗的輸入不出中文在終端輸入以下代碼即可// A code blockvar foo = 'bar';// An highlighted blocksudo apt-get install -f修復了依賴,在重啓就可以了

2020-10-29 20:25:16 112

原创 MySQL入门学习

1.MySQL的介绍MySQL是一种开放源代码的关系型数据库管理系统(RDBMS),使用最常用的数据库管理语言–结构化查询语言(SQL)进行数据库管理。MySQL支持FreeBSD、Linux、MAC、Windows等多种操作系统与其他的大型数据库例如Oracle、DB2、SQL Server等相比功能稍弱一些。MySQL数据库有如下几个特点:1、可以处理拥有上千万条记录的大型数据2、支持常见的SQL语句规范3、可移植行高,安装简单小巧4、良好的运行效率,有丰富信息的网络支持5、调试、管理,

2020-07-30 00:33:13 125

原创 k-means聚类算法

K_means聚类算法聚类算法是指将一组没有标签的数据自动划分成几类的方法,属于无监督学习方法,需要保证同一类的数据有相似的特征,如下图所示:根据样本之间的距离或者说是相似性(亲疏性),把越相似、差异越小的样本聚成一类(簇),最后形成多个簇,使同一个簇内部的样本相似度搞,不同簇之间差异性高。k-means聚类算法步骤如下图展示k-means聚类算法的流程图:...

2020-07-28 11:00:30 425

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除