自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 资源 (1)
  • 收藏
  • 关注

原创 公开的中文日记数据集合的爬取

A.目标的选定1.因为后面自己的毕业设计项目关于到了短日记中文情感分析模型的建立和训练,在网上收集训练集的时候找不到合适的日记训练集,找到的都是一些微博评论的数据,训练之后感觉这个微博评论数据集的准确率和适配性不是很好,于是产生了自己去制作一份带有标签的日记文本训练集,所以现在的任务是利用python爬虫爬取日记网站公开的日记内容2.在网络上面经过一段时间的资料收集,最后确定了网站为拉普达日记(http://www.lapuda.org/)因为这里的日记内容是按照有序的数字顺序存储的,这样有利于爬虫机械

2020-11-18 11:47:00 703 11

原创 广度优先搜索(BFS)最短路径输出表示(三种方法)

相信我,看完之后,你会对BFS有种全新的了解,彻底掌握BFS只需要这一篇就足够啦,狗头BFS路径表示广度优先搜索顾名思义就是以迷宫里的无向图某一个点,借助队列,一层一层以该点为中心散开进行搜索,简单的BFS只能显示出最短路径的长度,这里探讨的就是如何实现BFS对最短路径的输出简单的BFS通过队列来实现,找到迷宫的起点(S)入队,出队列里面的队首,把队首上下左右相邻的点入队列,一直重复此操...

2020-03-17 20:43:25 16942 7

原创 数据结构视频知识点整理 1

第一节.数据和算法常用时间复杂度大小关系O(1)<O(logn)<O(n)<O(nlogn)<O(n2)<O(n3)<O(2n)int sum=0;for(int i=0;i<=n;i=2*i){ sum=sum+i;}满足条件:2k<n => k<log2n时间复杂度 O(logn) 这里时间复杂度...

2020-02-28 10:46:23 1385

原创 英语单词词频统计(索引和堆的实现)--数据结构大作业

一.题目要求单词的词频统计(1)从文件中读出一篇英文文章,将不同的单词存入堆中,建立相应的索引表,索引表确定各单词在堆中存储的位置及出现的次数。(索引表的数据类型要求采用第4章课件中最后的应用举例的方式)(2)按出现的频率递减的次序输出结果并存入文件。(3)选做:查找、插入、删除等二.算法设计1.按照题目的要求我把整个程序分为以下8个部分A.从文件中读入一片英语文章B.将不同的单词...

2020-02-28 10:40:30 2211 3

原创 大数据技术与原理应用MOOC期末考试题目答案

前面每一个章节测试题目的链接点点这里看看!!

2020-12-27 11:53:23 7425

原创 简单python爬虫数据爬取的四部曲

对于生活中和日常中,我们可能会收集一下不是很大的网站资源,对于非爬虫工程师而言,我觉得应付日常的python爬虫,掌握一下四个小技巧就可以让生活或者学习事半功倍1.request请求网页资源得到源码通过requests库我们带一些简单的参数,可以让我们机械化重复性的获得大量网页带数据的源代码内容关于requests的更多的用法import requestsparas={ 'name':"xxx", 'password':"xxx"}headers = { 'Cookie

2020-12-22 12:20:31 428

原创 word中粘贴代码颜色高亮教学

一直能头疼写word论文中粘贴的代码又丑又难看,后来逛博客的时候发现了一种方法可以使粘贴到word上面的代码高亮显示,芜湖起飞!!首先新建TXT文件,将你要粘贴的代码复制进去将文件的后缀名改成这个代码语言,保存用notepad++打开,菜单栏找到插件插件–>NppExport–>Copy RTF to clipboard直接粘贴到word里面就好啦...

2020-12-21 22:57:04 2924 3

原创 大数据分析与建模部分一-核心概念汇总

笔者是一个数据科学专业点本科生,这段时间学习了核心课程的数据分析与建模,汇总了一些考试的核心概念,分享到此1.大数据的定义和4V特征大数据泛指无法在可容忍的时间内用传统的理论,方法和技术以及软硬件工具对其进行获取,管理和分析的巨量数据集合,包含4V特性:variety(多样性)value(价值低)volume(容量大)velocity(速度快)2.大数据存在的三个问题海量数据与分析处理实时性的之间的矛盾数据来源,数据种类和数据存储之间的矛盾传统数据管理和大数据管理模式之间的矛盾3.数据挖掘的概

2020-12-20 12:16:22 1188

原创 python学习知识点简要摘抄

记在前面无奈ing,自己想好好的掌握python已经有好长时间,无论是深度学习,机器学习还是web网页制作,爬虫的数据爬取和清洗这些知识都离不开python,我自己每一次想好好的入门python都失败了,看视频坚持不下去,去leetcode上面刷题基础知识语法又太差,故还是转向一门python的语法教学课,先好好的弄清楚python里面的语法知识再做接下来的打算吧,这一次一定要入门python…QAQ…...

2020-12-15 17:12:45 122

原创 python爬虫之正则表达式的运用

一.什么是正则表达式?通俗的理解就是对于一个目标串,我们通过正则表达式制定的一些规则和用法可以对这个目标串进行子串的模式匹配从而获得我们想要的数据,正则表达式能高效灵活的提取数据二.使用正则表达式A.库文件python的标准库当中re库包含了正则表达式的用法我们只需要调用即可import reB.常用的函数1.search函数若能找到目标串里面符合要求的元素,返回这一个元素的值可以通过group函数来查看这一个值若不能找到目标串里面符合要求的元素,则返回Noneimport re

2020-12-15 17:11:32 163

原创 蓝桥杯真题 十字图

问题描述小明为某机构设计了一个十字型的徽标,如下所示:层数为4层输入格式一个正整数 n (n<30) 表示要求打印图形的层数。输出格式对应包围层数的该标志。样例1n=1n=3算法分析这种题目一般是找规律来按照格式输出图,看到上面那三个层数分别为1,3,4的图形,我们慢慢的找规律,发现层数为1的话就是中间一个十字,外面套一圈黑点,再套一圈$符号,那么层数为n就是,中间一个十字,重复n次外面套一圈黑点,再套一圈符号,规律我们分析完之后看这个图像是中心轴对称的图像,我们可以考虑先

2020-08-08 12:40:40 643 1

原创 成绩排序

题目要求小蒜所在的学校一开学就进行了一次摸底考试。摸底考试考了语文、数学、英语、科学共四门课程。小蒜的老师汇总成绩后列出了成绩单,其中包括每个同学的姓名和四科的成绩。现在老师希望表扬一下每门课程考试得分前四名和总分前四名的同学,同分数的情况下,名字字典序更小的先表扬。请你帮助老师写一个程序,快速完成这件事情吧。算法分析这道题目考察了sort排序cmp函数的编写,主要的坑在名字字典排序那里,这个我们可以使用头文件为cstring的strcmp函数,这里第一个小于第二个值返回-1,等于的话返回0,大于

2020-08-08 12:18:51 900 1

原创 抢气球

题目要求教室的墙上挂满了气球,五颜六色,小朋友们非常喜欢。刚一下课,小朋友们就打算去抢这些气球。每个气球在墙上都有一定的高度,只有当小朋友跳起来时,手能够到的高度大于等于气球的高度,小朋友才能摘到这个气球。为了公平起见,老师让跳的低的小朋友先摘,跳的高的小朋友后摘。小朋友都很贪心,每个小朋友在摘气球的时候都会把自己能摘的气球都摘掉,很巧的是,小朋友们跳起来手能够着的高度都不一样,这样就不会有跳起来后高度相同的小朋友之间发生争执了。输入格式第一行输入两个空格分隔的整数 n,m(1≤n,m≤105),

2020-08-08 12:13:06 579

原创 跳台阶

题目要求n个台阶,一次走1阶或2阶,问走n阶有多少可能?(1<=n<=1000 000)结果用1000 0000 7取模输出算法分析这道题目确实乍一看完全没有头绪,但是我们可以先找找规律嘛,通过规律来分析问题解决问题台阶数1-----------1种方法台阶数2-----------2种方法台阶数3-----------3种方法台阶数4-----------5种方法台阶数5-----------8种方法台阶数6-----------13种方法台阶数7-----------2

2020-08-06 10:49:13 117

原创 sort排序讲解

1.需要头文件算法库#include<algorithm>2.常规的使用方法int a[]={5,3,1,5,2}; sort(a,a+3);//对第一个到第三个元素进行排序 int length = sizeof(a)/sizeof(a[0]);//计算数组的长度 for(int i=0;i<length;i++){ cout<<a[i]<<" "; }结果输出为:1 3 5 5 2上面的是升序的排列方式,如果要使用降序的排列方式增

2020-08-06 10:20:49 593

原创 最后一个单词的长度

题目要求给定由大写,小写字母和空格组成的字符串,返回最后一个单词的长度。如果输入中不存在单词,返回 000。注意:“单词”是指不包含空格符号的字符串例如:对于字符串"hello World"(不带引号), 那么返回的结果是 5;对于字符串"abc abc "(不带引号),那么返回的结果就是 3。输入要求输入仅一行,为字符串 sss(长度不超过 10000)。输出要求输入最后一个单词的长度算法思想我们考虑到string函数当中的size()和rfind()两个函数,通过size函数看

2020-08-05 22:30:07 253

原创 计算每年的节假日

题目要求日历有 阳历(公历) 和 阴历(农历) 之分。每年都有法定节假日,这些分成三类——双休、阳历节假日、阴历节假日。双休1)周六和周日 2天阳历节假日1)元旦:阳历每年 1 月 1 日,放假 1 天2)劳动节:阳历每年 5 月 1 日,放假 1 天3)国庆节:阳历每年 10 月 1 日,放假 3 天4)圣诞节:阳历每年 12 月 25 日,放假 1 天阴历节假日1)春节:阴历每年 1 月 1 日,放假 3 天2)清明节:阳历每年 4 月 4 - 6 日之间的某天,放假 1天3)端

2020-08-05 15:06:35 1813

原创 日期计算简单程序

题目要求给定一个日期和一个具体的天数,计算过了这个天数后日期的具体值算法分析这种日期题目模拟有点稍微复杂,对于数据量不大的情况下面干脆直接按照天数增加来模拟,满月进1天数归0,月满进年天数归0#include<iostream>#include<cstdio>using namespace std;int monthday[13]={0,31,28,31,30,31,30,31,31,30,31,30,31};int main(){ int y,m,d,num;

2020-08-05 13:32:55 1000

原创 计算星期几--蔡吉姆拉尔森公式的使用

这个公式可以有效的计算当前日期是星期几w=(d+2m+3(m+1)/5+y+y/4-y/100+y/400)%7但是要注意的是每一年的一月份和二月份要当做上一年的十三月份和十四月份来进行计算公式计算代码#include <iostream>#include <string>using namespace std;int whatday(int y, int m, int d) { if(m<=2){ m+=12;y--; }

2020-08-05 10:23:45 274

原创 奇数魔方阵

题目要求魔方阵,古代又称“纵横图”,是指组成元素为自然数1、2…n的平方的n×n的方阵,其中每个元素值都不相等,且每行、每列以及主、副对角线上各n个元素之和都相等。阶数大于等于3。如3×3的魔方阵:  8 1 6  3 5 7  4 9 2  奇数魔方阵的排列规律如下:  (1)将1放在第一行中间一列;  (2)从2开始直到n×n止各数依次按下列规则存放;每一个数存放的行比前一个数的行数减1,列数加1(例如上面的三阶魔方阵,5在4的上一行后一列);  (3)如果上一个数的行数为

2020-08-05 09:09:23 1391

原创 统计一行的单词数量

题目要求从键盘输入一行字符,长度小于1000,统计其中单词的个数,每个单词以空格分隔,且空格数可以是多个。输入一行句子,仅有空格和英文字母构成。输入要求输入只有一行句子,由空格和英文字母或者逗号构成。逗号和单词之间一定存在空格。输出要求输出这一行单词里面单词的个数#include<iostream>#include<cstdio>#include<string>#include<vector>using namespace std;int

2020-08-03 08:16:19 310

原创 橘猫图书管理系统--数据库原理期末项目

需求分析图书馆作为文学的聚集地和展示平台,书籍是从古至今文化传递记载的介质。图书馆是高校不可缺少的基础设施,图书馆管理系统是图书馆正常运转的关键。此次数据库课程设计采用C++语言编写程序,实现图书登记、删除、查询、浏览、读者借阅、还书、会员登录、密码修改等功能。程序包括数据链表和文件指针的操作,包括结构数据的定义和使用,文件的读写、定位和修改。橘猫书馆管理系统主要是完成对书籍,书的种类,学生借阅信息的管理,能够有效的查看借阅记录以及书籍信息。从而减轻书馆管理者的人工负担。书馆管理员首先完成对图书类别管理

2020-07-30 00:54:52 419

原创 二叉树算法--数据结构课程设计

题目要求:二叉树算法设计TXT文件内容(Btree.txt):1 2 4 8 0 0 9 0 0 5 0 0 3 6 0 0 7 0 0一定注意,这里文件按照前序遍历的数字形式,空树按照0进行表示,每个数字间空格,这样能区分十位数还是个位数,并且只能是纯数字代码展示:#include<iostream>#include<stdio.h>#include<malloc.h>#include<queue>#include <string.

2020-07-20 13:46:42 1160

原创 算法基础学习之位运算符

前置知识学习:1.逻辑运算符:与&& 或|| 非!与运算: 1&&1=1 1&&0=0 0&&1=0 0&&0=0或运算: 1||1=1 0||1=1 1||0=1 0||0=0非运算: !1=0 !0=1计算机中一般来说int存储32位的数据-2147483648 ~ 2147483647位运算符定义:在处理整形数据的时候,我们可以采用位运算的形式对这个整形数据的二进制表达形式中的每一个位进行操作,通

2020-07-01 17:13:03 5119

原创 数据结构课程设计——交换排序作业

题目要求:交换排序的比较【基本要求】(1)生成一组随机数以顺序方式存储,并输出。(2)分别利用单向起泡排序法和双向起泡排序法进行排序,同时统计各算法比较次数和移动次数,并显示结果。(3)利用快速排序法排序,同时统计比较次数和移动次数,显示结果。(4)判断一组数据是否有序。(5)将所有奇数调到偶数之前。(6)选做:求出一组数据中按值大小排在第k位的数据(不需要排序)。#includ...

2020-03-17 09:44:20 440

C++图书管理系统_数据库原理程序期末设计

数据库原理程序的期末设计,编写的是C++的图书管理系统,一般的注册登录,图书操作,借阅信息的操作都具备了,增添了一点好看的代码小猫,比较不错

2020-07-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除