自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 资源 (5)
  • 收藏
  • 关注

原创 Python 爬虫爬取网页内容(lxml+requests)(#有手就行系列)

#有手就行系列 – 网页爬取(简易版) 1、准备阶段 1)下载[链接的代码文档](https://download.csdn.net/download/anbula/20086749)(anaconda打开)或是文末的代码 2)进行尝试,点击运行查看是否有报错 ![在这里插入图片描述](https://img-blog.csdnimg.cn/20210708154955167.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shado

2021-07-08 17:00:15 1572

原创 # 纠正一下- 正式决定干数分的第二十六~第三十四天

纠正一下- 正式决定干数分的第二十六~第三十四天 搞《统计学习导论-基于R应用》《深入浅出Pytorch》和《Hive编程指南》三本书,学到了三分之一,理论打扎实先

2021-06-18 21:08:57 137 1

原创 # 正式决定当程序员的第十七天~二十五天

正式决定当程序员的第十七天~二十五天 1、理论学习 这几天反复温习了一下mysql的语句,同时校内实习复习了一下深度学习的基础算法,numpy库等 也学习了一点基础的冒泡排序、选择排序和双指针算法,leetcode真是对我来说太难了emm。 import numpy as np score = np.array([[80,89,86,67,79], [78,97,87,67,81], [90,94,78,67,74],

2021-06-09 21:45:42 132

原创 # 正式决定当程序员的第十一~十六天

正式决定当程序员的第十一~十六天 1、理论学习 这几天学习了mysql的多表连接查询(交叉连接查询、内连接查询、外连接【左外/右外】查询和子查询,多多练习提高代码效率,再看看还有没有更进一步的操作学习内容,并补充学习了数据库理论知识,b+树MySQL索引 - 底层实现 - B+树/Hash索引MySQL索引底层实现原理 1)索引是帮助MySQL高效获取数据的数据结构。由于优化诞生例如二分查询、二叉树查询等(需要自我补充学习时间/空间复杂度) 2)二叉排序树/平衡二叉树 3)B树。事实上是一种平衡的多叉查找树

2021-05-31 21:57:04 224

原创 # 正式决定当程序员的第十天(MySQL)

正式决定当程序员的第十天 (MySQL) 1、理论学习 SQL语言类别: 数据操纵语言DML 适用范围:对数据进行简单操作 代码:insert,delete,update,select等 数据定义语言DDL 适用范围:对某些对象进行管理,用来创建数据库中的各种对象(表、视图、索引、同义词、聚簇等) 代码:Create,Alter,Drop,Show,Desc 两者区别: 1、DML操作是可以手动控制事务的开启、提交和回滚的。 2、DDL操作是隐形提交的,不能rollback 数据控制语言DCL 适用范围:用

2021-05-25 22:12:01 106

原创 # 正式决定当程序员的第九天

正式决定当程序员的第九天 1、工作总结 老样子跑代码,但是爬虫储存的时候会略过已经储存过的网站内容,导致部分断点在调试时没有设置好,部分代码无法验证有效性,难受的一。 2、学习总结 今天学习数据库的三种模式和两种映射,大致了解了一下笛卡尔积、二叉树查询、balance树和B+树的理论知识,实操了一下数据库代码,增删查改,设置主键和外键等,代码与学习链接如下 MySQL 有这一篇就够(呕心狂敲37k字,只为博君一点赞!!! 3、错误总结 error code 1046,基本上是漏了“;” error code

2021-05-24 23:24:10 111

原创 # 正式决定当程序员的第七、八天

正式决定当程序员的第七、八天 1、日常总结 这两天一直想要尝试用lxml或者是beautifulsoup爬取页面的所有xpath路径,再根据需求查找类似的组件进行全局爬取,但是一直没有成功,还要继续搭建。失败了之后补充学习一点mysql知识,增加lxml的系统学习。再修改修改简历,美滋滋。 2、学习链接 MySQL 有这一篇就够(呕心狂敲37k字,只为博君一点赞!!!) 3、学习总结 学习了一些mysql语句并上手实践一下, show db create table db alter table db 命令

2021-05-23 23:02:16 144

原创 #正式决定当程序员的第六天

正式决定当程序员的第六天 今天尝试写一个通用爬虫代码,打代码中…… #纪念第一次把想法打完

2021-05-21 23:28:35 114

原创 正式决定当程序员的第三天

正式决定当程序员的第三天 今天正式接触到了项目代码了,接触到了ETL数据采集系统,和windows vps配置。在数据库内容方向还是差的很多啊,很多代码都忘了,只能基础的 select*from 【表】 where 【条件】=? 1、error 今天都是一些vps配置的问题,例如python版本不适配等等,数据库索引不到位,采集框架不熟悉的问题。 2、小结 明天好好温习一下sql常用语句再熟悉一下系统框架吧 #正式接触项目的第一天 ...

2021-05-18 23:05:33 118

原创 # 正式决定当程序员的第二天

正式决定当程序员的第二天 劳累的一天结束啦,明天工程师就会带我捋一遍开发采集阶段的系统框架,今天摸鱼的间隙学习了一下selenium lxml re和requests库,收获还不错! 1、error 总结一下碰到的error 1)WebDriverException: Message: ‘chromedriver’ executable needs to be in PATH. 这个问题下载一个chromdriver就好啦,系统问题配置起来有点麻烦 http://npm.taobao.org/mirrors

2021-05-17 22:48:37 436

原创 # 正式决定当程序员的第一天

正式决定当程序员的第一天 作为一个双非院校的管科学生,在专业课之余学过一点python,打过swift,了解过深度学习,面临还有一年的毕业,去留学吧,专业匹配度只能去选择管科专业,去找实习吧,又连技术岗的一面也过不了。 面对非常不喜欢的专业,原本打算在更进一步学习本专业的同时也学习技术,但是巧在有一家还不错的公司愿意收留我并在工作中教我更多的代码能力,思考良久还是兴趣更为重要,明天就要上班了,实习中好好学习,认真打代码吧! #纪念我真正向程序员努力的第一天 ...

2021-05-16 17:23:54 156

Lancaster University - Agency Authorisation Form.pdf

Lancaster University - Agency Authorisation Form.pdf

2021-12-22

274.H指数.ipynb

leetcode题目练习

2021-07-11

爬虫模版1.0.ipynb

爬虫模版1.0.ipynb

2021-07-08

代码5 .17 漂亮汤和一些爬虫

代码5 .17 漂亮汤和一些爬虫

2021-05-17

KNN算法11111

初学打得算法!

2020-12-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除