自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 计算机二级Python历年真题解答(第四套)

进来看看,保证过计算机python的二级!解答都超级简单~

2022-03-12 14:05:23 1733

原创 计算机二级Python历年真题解答(第十二套)

历年计算机python考试真题全解析,比参考答案更简洁,更易懂

2022-02-20 20:42:23 2142

原创 改进版爬取猫眼电影,信息最全,beautifulsoup+re

改进版爬取猫眼电影,信息最全,采用beautifulsoup+re

2021-12-06 16:17:25 795

原创 机器学习训练数据(fit)时出现错误:ValueError:Unknown label type:‘continuous‘

我在网上包括csdn都没有找到正确的解决办法,都是转换成int或者乘一个数什么的,但实际上对于回归任务,浮点数的标签是不能更改的,这样会极大的影响误差。我的办法是,先转换成int,再转换成浮点型就可以了具体的,例如 y.astype(int).astype(float)...

2021-04-28 00:12:51 3791 14

原创 中型项目(1)——电信用户购买套餐分析预测(基于python)

数据来源是在kaggle上下载的,或者来自某个社区的数据集全流程1,导入包import warningsfrom pandas_profiling import ProfileReportfrom lightgbm import LGBMClassifierfrom sklearn.multiclass import OneVsRestClassifierfrom sklearn.metrics import roc_curvefrom sklearn.metrics import f1_

2021-04-26 16:57:18 865 1

原创 leetcode,lintcode刷题心得(2)——动态规划——背包问题——lintcode综合排名前三

我对背包问题的看法由于琢磨了一道最基础的题目,找打了空间复杂度为o(n)的算法思路如下,dp[i]表示第i个目标值时的最大容量或者价值如果可以重复,则对dp的内循环采用从小到大的策略否则,从大到小循环注意的是,边界条件的选取。对于这个选取,我喜欢举一个小栗子,通过流程图,直观的看出细节一些小栗子Lintcode 92 背包问题1class Solution: #d[j]表示当size等于j时,最多能承重的大小 def backPack(self, m, A):

2021-04-25 14:55:06 180

原创 leetcode,lintcode刷题心得(1)——动态规划

写在前面从今天起,决定写这么一个专栏,记录自己的心得,无欲无求,权当是我的见证正题今天学习了一下动态规划,边刷题边找感觉,慢慢的随心应手了起来,最开始一脸懵逼,通过在leetcode上仔细琢磨了一道题的思路——没错,就是经典的爬楼梯,逐渐找到了感觉。从一开始,一道半个小时,到后面,一道题5-10分钟,还是蛮有成就感的动态规划目前做的题目,我的思路大概是这么一个流程1,找边界,一般是起始点2,找转移方程,一般是倒推出来3,根据题意建立dp的起始空间4,根据转移方程,建立dp的方程几个粟子

2021-04-24 21:56:41 152

原创 禁止套娃!在csdn上写在csdn上的爬取的csdnTop100热榜,并进行数据分析(巨简单,快进来看看!)

分析通过f12,再XHR过滤掉其它内容,容易找到Top100的接口是这样的url = 'https://blog.csdn.net/phoenix/web/blog/hotRank?page=' + \ str(i)+'&pageSize=25'总共4页,用一个循环搞定接着博主采用了json库解析ps,csdn的cookie真持久,昨晚来不及爬取了,现在没更新cookie,依然能用…最后用二维列表储存用pandas输出csv文件总共20行有效代码吧,非常easy

2021-04-23 23:14:37 271

原创 sql还不会计算时间差?timestampdiff(),datediff()教你

timestampdiff()接受三个参数一个指定是计算年份差,还是月份差,或者其它和日期有关的后两个参数指定两个具体的时间实例:select timestampdiff(month, created_at, '2020-04-22')as MonthDifffrom coursesdatediff()这是一个隐藏函数,通常用来计算天数差接受两个具体时间参数实例:select datediff('2020-1-1','2020-1-2')...

2021-04-20 13:58:19 822 1

原创 全网最简单的15行代码爬取猫眼电影,快进来学!

分析看官,点个赞呀~很需要你们的支持请求头,cookie,user-agent这些信息,请F12,就看得到;url,只需要注意一点,每新一页page增加30;解析网页用的Beautifulsoup;提取信息使用的re;保存信息使用的pandas;其它见代码,非常简单,可以尝试跟着敲一敲import requestsfrom bs4 import BeautifulSoupimport timeimport reimport pandas as pdheaders = {

2021-04-19 23:54:07 951 3

原创 SQL保留有效小数,round()

今天刷sql题目的时候,遇到了这个问题,特地记下来。使用round()函数,接受两个参数,一个是需要保留小数的数据,一个是指定保留多少位例如round(2,3)输出的即是2.000,保留三位有效数字实例select name,round(avg(score),2) as average_scorefrom (select c.name name,r.score score from rankings r inner join categories c on r.category_id=c.id) a

2021-04-18 16:25:08 2016

原创 简单分析top250的数据(三)

说明这个top250系列(二)爬取到了很多信息,接下来简单分析一下小声bb——比较忙,没什么文字,来不及陈述分析过程及结论(哭)首先引入必要的库import warningsfrom pandas_profiling import ProfileReportfrom collections import Counterimport numpy as npimport pandas as pdimport seaborn as snsimport matplotlib.pyplot a

2021-04-18 12:33:22 123 2

原创 35行代码爬取豆瓣top250最全信息,Beautifulsoup(二)

说明看官多多点赞呀~上次爬取到了电影名,但远远不够,笔者试图对top250再进行数据分析,因此需要爬到更多的信息。代码如下,应该是CSDN代码量最少最简单的了~关于怎么保存爬取的数据,参看我之前的博客,很简单的;另外,为防止被封,爬取一页需要短暂的sleep(),我设定的1simport requestsfrom bs4 import BeautifulSoupimport timeimport reimport pandas as pdheaders = { 'Cookie':

2021-04-17 10:36:09 505 5

原创 sql-插入当前时间

描述向记录表 records 中插入当前的日期解决主要记得有这么两个函数,now(),current_date(),因此insert into records values (now())insert into records values (current_date())

2021-04-15 21:44:09 8590

原创 将爬取的top250数据加以保存(文本,excel,sql)

将爬取的top250数据加以保存(文本,excel,sql)接着上篇的top250,我们得到top250的title,现在保存它!文本这个只需要熟悉文本的操作即可,注意换行!n=0with open('top250.txt', 'w') as f: #l列表储存的电影title for i in l: f.writelines('{},{}'.format(n, i)+'\n') n += 1结果大家自己运行一下咯~excel这个可以用到许多库,最

2021-04-15 12:47:05 142

原创 八行代码爬取豆瓣TOP250(一)

八行代码爬取豆瓣TOP250这里使用了bs4库,解析html非常好用,此处为展示它的快速强大,借用下例说明,仅用8行代码便爬取到了top250的电影名字import requestsfrom bs4 import BeautifulSoupheaders = {#此处填写cookie,User-agent}for i in range(25): #html通过request请求得到,().text将()转化成文本 html= requests.get( 'https:

2021-04-15 11:11:04 182

原创 码无止境(3)——处理excel数据并用pygal和pylot作图(适合萌新)

写在前面:我是一名大二在读的学生,专业是财务管理,与代码没有一点关系的,oh。但非常喜欢编程,目前正在努力学习,希望大家多多支持,嘿嘿问题描述:有一张excel表,如下图:我们的任务是根据这张表,统计不同学院开设的不同课程的门数,并将其图表可视化。这个任务的难点是对于同一门课程,同一个学院会因为设置不同的老师教授以及不同的上课时间,因此需要去重操作。解决方案:对于大佬来说,这个任务用numpy和pandas应该能很快并且很简洁地完成。对于萌新以及我自身来说,我考虑的是利用openxyl库提取数据,p.

2020-11-24 10:44:57 210

原创 码无止境(2)——关于批量文件复制的一个训练(shutil.copyfile的应用)

写在前面:大家好,我是来自财务管理专业的大二学生,这是我的第二个博客啦问题导入:有一个表格,里面储存有学生的学号和姓名信息;有一堆学生提交的python文件作业。现在需要根据文件名提取学号,以统计交作业名单,并复制该文件,以学号命名移到规范文件夹里,并将文件名不规范的移到新目录下不规范文件夹里解决方案:我给出的方案如下,注释相当清楚,便于萌新阅读,也欢迎讨论哦import openpyxlimport osimport shutilos.mkdir('不规范文件') #创建不规范目录o.

2020-11-18 22:20:23 176

原创 码无止境(1)——一个科研项目立项时的小程序(字典嵌套列表)

这里写自定义目录标题前言:主体:前言:大家好,我是财务管理专业的一名大二学生,业余喜欢敲敲代码,目前在钻研python。设立这么一个栏目呢,希望自己能记录下代码的点点滴滴,因为我相信每一段代码都是有感情的,或为之欣喜,或为之烦恼。如果有和我一样是编程新手的童鞋,欢迎一起交流进步。主体:由于我和我的组员目前在一个比赛立项,需要一些初步成果出来,因此设想的是在未来的数据上做些"手脚"。具体的,需要我对拿到的数据进行初步筛选。详细解释见代码import openpyxl #使用到了openxyl库

2020-11-16 16:24:29 428

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除