自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 Maven报错

最近刚刚学到maven的配置解决了一个错误,望大家不用白做无用功只需要在c盘下的用户搜索.m2文件夹C:\Users\XXXXXX.m2\repository\org\apache\maven\plugins在IDEA中添加标签将文件导入即可

2021-10-11 15:43:46 173

原创 protege初学笔记--01

Classes类:一类个体的集合Subclassof(子类):类与类之间的父子关系Equivalent(等价):类的相同类,主要用于推理(推理出各个类之间的关系,用com.clarkparsia.protege.plugin.pellet.jar推理机)。Disjoint:类的互补相交关系,即一个个体不能同时属于两个类Object Properties对象属性描述:用来连接两个个体,例如;长颈鹿类–eat–叶子类,其中eat就是定义的对象属性,将两个类进行连接。...

2021-07-01 16:17:24 730

原创 scrapy框架(二)

创建一个scrapy项目:scrapy stratproject myspider#最后一个是名字可更改生成一个爬虫scrapy genspider baidu "baidu.cn"提取数据:使用xpath等方法保存数据:pipeline(管道)中保存数据具体操作import scrapyclass ItcastSpider(scrapy.Spider): name = 'itcast'#爬虫名称 allowed_domains = ['itcase.cn']#允许爬

2020-11-17 17:20:13 133

原创 scrapy框架(一)

scrapy框架框架:就是一个集成了很多功能,并且具有很强通用性的一个项目模板。学习框架:学习框架封装的详细用法scrapy:基于爬虫中封装好的明星框架功能:高性能的持久化存储、异步数据下载、高性能的数据解析、分布式scrapy框架的基本使用:框架环境安装:pip install wheel 下载twisted,下载地址为 https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted 安装twisted:安装的twist必须根据python对

2020-11-17 16:12:09 146 1

原创 XPath数据解析

XPath数据解析xpath解析原理:①:实例化一个etree对象,且需要将被解析的页面源码数据加载到该对象中②:调用对象中的xpath方法,结合xpath表达式实现标签的定位和内容的捕获③:环境安装pip install lxml如何实例化一个etree对象:from lxml import etree①:将本地的html文档当中的源码数据加载到etree对象中:etree.parse(filePath)②:可以将从互联网上获取的源码数据加载到该对象中:etree.HTML('page_t

2020-11-17 16:08:06 646

原创 bs4进行数据爬取

bs4只可以应用在python中数据解析的原理:标签定位提取标签、标签属性中存储的数据值bs4数据解析的原理:1、实例化一个BeautifulSoup对象,并且将页面源码数据加载到该对象中2、通过调用BeautifulSoup对象中相关的属性或者方法进行标签定位和数据提取环境安装:以管理员的身份打开cmdpip install bs4pip install lxml如何实例化BeautifulSoup对象:from bs4 import BeautifulS

2020-11-03 14:40:16 1368

原创 正则表达式进行数据爬取

聚焦爬虫:爬取页面中指定的内容指定 url发起请求获取响应数据数据解析持久化存储数据解析分类:正则,bs4,xpath(*通用性强)数据解析原理:解析的局部的文本内容,都会在标签或者标签对应的属性中进行存储进行指定标签定位标签或者标签对应的属性中存储的数据值进行提取①:正则表达式—. :除换行以外所有字符[] :[aoe] [a-w]匹配集合中的任意一个字符\d :数字【0-9】\D :非数字\w :数字、字母、下划线、中文\W :非\w\s :所有的空白字符包,包

2020-10-29 08:43:01 2110

原创 python爬取三元组数据笔记(三)

python爬取三元组数据笔记(三)需求:爬取国家药品监督管理总局中基于中华人民共和国化妆品生产许可证相关数据http://125.35.6.84:81/xk/分析:首先确定页面上的信息是那个url响应的。我们直接导入http://125.35.6.84:81/xk/ 的url发现没有数据。在network中寻找真正的url地址,发现信息是由ajax请求的。其次,打开链接详情页url的域名都是一样的,只有携带的参数(id)不一样id值可以从首页对应的ajax请求到json串中获取域名和id值

2020-10-28 14:28:15 832

原创 python爬取三元组数据笔记(二)

需求:爬取豆瓣电影中的电影详情数据

2020-10-20 17:20:09 472

原创 python爬取三元组数据笔记(一)

python爬取三元组数据笔记(一)1、什么是爬虫?通过编写程序,模拟浏览器上网,然后让其去互联网上抓取数据的过程。2、爬虫的分类:通用爬虫:抓取系统的主要组成部分,通常抓取的是一整张页面数据。聚焦爬虫:建立在通用爬虫的基础之上,抓取的是页面中特定的局部内容。增量式爬虫:检测网站数据更新情况,只会爬取网站中最新更新的数据。3、robots.txt 协议规定了网站中哪些数据可以被爬虫爬取。4、http协议概念:是服务器和客户端进行数据交互的一种形式。常用的请求头信息:User-Ag

2020-10-19 10:39:57 1918

原创 初步学习知识图谱笔记(一)

初步学习知识图谱笔记(一)1、neo4j下载(neo4j是知识图谱的图数据库)https://blog.csdn.net/pmrogrammer/article/details/104273609有详细的下载方法和环境配置方法。重点:::jdk1.8版本的一定不要安装版本最新的neo4j。3.5.5就好。2、学习neo4j。在网页打开neo4j修改密码之后点击write code有导演案例。3、neo4j的图数据库基本元素与概念节点(node):表示一个实体记录,一个实体包含多个属性和标

2020-10-15 11:00:34 259

原创 电文密码问题

题目:有一行电文,已按照下面规律译成密码:A-Z B-Y C-Xa-z b-y c-x即第一个字母变成第26个字母,第i个字母变成第(26-i+1)个字母。非字母字符不变。要求编译程序将密码译回原文,并输出密码和原文。for();后面有分号就代表着这是一个普通的语句字符数组不可以直接进行运算,注意哦思路:①:分为三个数组,一个是被赋值的数组,一个是大写字母数组和小写字母数组②:进行...

2020-03-24 21:38:32 1212

原创 鞍点

题目:找出一个二维数组中的鞍点,该位置上的元素,在该行上最大,在该列上最小,也可能没有鞍点。思路:①:为数组赋值②:找到每行中最大的数③:判断在j列中有没有比他小的④:若有值,则输出该行列的位置。否则,输出none#include<stdio.h>void main(){ int a[3][3]; int i,j,k; int count=0; int flag...

2020-03-24 19:17:44 113

原创 数组-魔方阵

魔方阵:就是指每一行,每一列和对角线之和均相等。如8 1 63 5 74 9 2算法:①查阅资料可知,每个魔方阵的第一行最中心位置都为1.所以,要确保魔方阵的阶数为奇数。②每一个数存放的行都比上一个数的行数减一,列数加一。③如果行数为第一行,则下一个行数为最后一行。列数加一④如果一个数的列数为最后一列,则下一列就是第一列。⑤如果按照规则下一个数的位置有值的话,则把下一个数放在这个...

2020-03-24 15:03:36 1333

原创 用筛选法求100以内的素数

素数(质数):是指在大于1的数中,除了1和他本身以外,不被任何数整除的数。题干:用筛选法求100以内的素数。思路:1、用数组进行赋值,将1-100赋值给a[1]-a[100]。2、两层循环,进行除法,把不为素数的数,同一表示成a[]=03、将a[]!=0的数进行输出。#include <stdio.h>#include <math.h>void main()...

2020-03-23 22:01:12 1138

原创 ## C语言课后习题-循环

C语言课后习题-循环分数序列:2/1,3/2, 5/3, 8/5, 13/8…求前20项的和。虽然麻烦了点,但是很好理解,嘻嘻!!先为s[20]和a[20]分别赋值后,进行两个数组相除。#include <stdio.h>void main(){ int i; float sum=0; float s[20],a[20]; s[0]=2; s[1]=3; ...

2020-03-21 20:37:01 366

原创 ## C语言课后习题-完数

C语言课后习题-完数一个数如果恰好等于它的因子之和,这个数就是“完数‘’。例如6的因子为1,2,3,而6=1+2+3,因此6是完数。编写程序找出1000以内的所有完数,并按照下面格式输出其因子:6 its factors are 1,2,3思路:1-想到是两层循环才可以完成2-想到有一个变量应该和外层循环的值比较。才可以输出3-外层循环应该从2开始。并且每次循环都应该刷新sum的值#...

2020-03-20 21:12:16 236

原创 链表实现约瑟夫环问题

约瑟夫环(约瑟夫问题)是一个数学的应用问题: 已知n个人(以编号1,2,3...n分别表示)围坐在一张圆桌周围。 从1开始报数,数到m的那个人出列; 他的下一个人又从1开始报数,数到m的那个人又出列; 依此规律重复下去,直到圆桌剩下最后一个人,求那个人的位置。 总体思路: 1:创建链表(用尾插法创建) 2:当人数大于1的时候,循环删除m 3:将最后一个人的地址...

2020-03-17 16:27:28 439

原创 初学链表-1

#include <stdio.h>#include <stdlib.h>//说明使用堆区(空间大,快)struct list //结构体名list,也就是说定义这个节点包括两个部分(data 和指针){int data;struct list *next;};//定义一个别名struct list node;struct list *link;//定义一...

2020-03-09 16:28:36 167

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除