![](https://img-blog.csdnimg.cn/20190927151101105.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
Datawhale组队学习
Datawhale组队学习
Sapphire~
这个作者很懒,什么都没留下…
展开
-
Datawhale组队 26 期 Linux(未):Task01---Linux简介
什么是LinuxLinux,全称为GNU/Linux,是一种免费使用和自由传播的类UNIX操作系统,我们常说的Linux,指的是Linux内核,一个基于POSIX的多用户、多任务、支持多线程和多CPU的操作系统。一、为什么要使用LinuxLinux有以下众多特点:开源免费多用户、多任务安全可靠稳定多平台二、发展历程在荷兰当教授的美国人AndrewS.Tanenbaum编写了一个操作系统,名为MINIX,为了向学生讲述操作系统内部工作原理。芬兰赫尔辛基大学大学二年级的学生Linus原创 2021-06-13 16:44:16 · 230 阅读 · 2 评论 -
Datawhale组队 15 期 Python:Task09---文件与文件系统
文件与文件系统打开文件open(file, mode=‘r’, buffering=None, encoding=None, errors=None, newline=None, closefd=True) Open file and return a stream. Raise OSError upon failure.file: 必需,文件路径(相对或者绝对路径)。mode: 可选,文件打开模式buffering: 设置缓冲encoding: 一般使用utf8errors: 报错级别原创 2020-08-08 21:28:55 · 119 阅读 · 0 评论 -
Datawhale组队 15 期 Python:Task08---模块与datetime模块
模块Python 提供了一个办法,把这些定义存放在文件中,为一些脚本或者交互式的解释器实例使用,这个文件被称为模块(Module)。模块是一个包含所有你定义的函数和变量的文件,其后缀名是.py。模块可以被别的程序引入,以使用该模块中的函数等功能。这也是使用 Python 标准库的方法。什么是模块容器-> 数据的封装函数 -> 语句的封装类 -> 方法和属性的封装模块 -> 程序文件命名空间命名空间因为对象的不同,也有所区别,可以分为如下几种:内置命名原创 2020-08-07 17:50:56 · 149 阅读 · 0 评论 -
Datawhale组队 15 期 Python:Task07---类、对象与魔法方法
类与对象对象中 = 属性中 + 方法对象是类的实例。换句话说,类主要定义对象的结构,然后我们以类为模板创建对象。类不但包含方法定义,而且还包含所有实例共享的数据。特点封装:信息隐蔽技术Python中的类名约定以大写字母开头Python类也是对象。它们是type的实例 print(type(Turtle)) # <class ‘type’>继承:子类自动共享父类之间数据和方法的机制多态:不同对象对同一方法响应不同的行动这个不同对象直接也要是继承关系才行吧?s原创 2020-08-05 20:37:09 · 146 阅读 · 0 评论 -
Datawhale组队 15 期 Python:Task06---函数与Lambda表达式
06原创 2020-07-31 14:52:24 · 172 阅读 · 0 评论 -
Datawhale组队 15 期 Python:Task05---字典、集合和序列
字典可变类型与不可变类型序列是以连续的整数为索引,与此不同的是,字典以"关键字"为索引,关键字可以是任意不可变类型,通常用字符串或数值。字典是 Python 唯一的一个 映射类型,字符串、元组、列表属于序列类型。那么如何快速判断一个数据类型 X 是不是可变类型的呢?两种方法:麻烦方法:用 id(X) 函数,对 X 进行某种操作,比较操作前后的 id,如果不一样,则 X 不可变,如果一样,则 X 可变。便捷方法:用 hash(X),只要不报错,证明 X 可被哈希,即不可变,反过来不可被哈原创 2020-07-30 16:57:53 · 168 阅读 · 0 评论 -
Datawhale组队 15 期 Python:Task04---列表、元组和字符串
x = [[0 for col in range(3)] for row in range(4)]怎么拆解?复制列表中的所有元素(浅拷贝)。浅拷贝与深拷贝区别?前面三种方法(append, extend, insert)可对列表增加元素,它们没有返回值,是直接修改了原数据对象。 而将两个list相加,需要创建新的 list 对象,从而需要消耗额外的内存,特别是当 list 较大时,尽量不要使用 “+” 来添加list。x.reverse() 该方法没有返回值,但是会对列表的对象进行排序。练习题:原创 2020-07-28 16:16:36 · 192 阅读 · 0 评论 -
Datawhale组队 15 期 Python:Task03---异常处理
pp原创 2020-07-25 22:19:43 · 90 阅读 · 0 评论 -
Datawhale组队 15 期 Python:Task02---条件循环语句
条件语句ifif - elseif - elif - elseassertassert这个关键词我们称之为“断言”,当这个关键词后边的条件为 False 时,程序自动崩溃并抛出 AssertionError 的异常。常见用法及场景:格式:assert 表达式 [, 参数]当表达式为真时,程序继续往下执行;当表达式为假时,抛出 AssertionError 错误,并将 参数 输出场景:在进行单元测试时,可以用来在程序中置入检查点,只有条件为 True 才能让程序正常工作。原创 2020-07-23 16:06:17 · 109 阅读 · 0 评论 -
Datawhale组队 15 期 Python:Task01---变量、运算符与数据类型
注释表示注释,作用于整行。‘’’ ‘’’ 或者 “”" “”" 表示区间注释,在三引号之间的所有内容被注释运算符算术运算符/ 除 3 / 4 # 0.75// 整除(地板除) 3 // 4 # % 取余 3 % 4逻辑运算符位运算符...原创 2020-07-22 14:36:13 · 120 阅读 · 0 评论 -
Datawhale第十二期组队学习--Python爬虫编程实践 Task01:html等有关知识,api使用,request-get使用
学习参考链接一. 互联网 HTTP互联网互联网也叫因特网(Internet),是指网络与网络所串联成的庞大网络,这些网络以一组标准的网络协议族相连,连接全世界几十亿个设备,形成逻辑上的单一巨大国际网络。互联网并不等于万维网(WWW),万维网只是一个超文本相互链接而成的全球性系统,而且是互联网所能提供的服务之一。HTTPHTTP是一个客户端(用户)和服务器端(网站)之间进行请求和应...原创 2020-04-21 15:50:41 · 202 阅读 · 0 评论 -
Datawhale第十二期组队学习--Python爬虫编程实践 Task04: 大作业:爬取news; 拔高:某乎爬虫
作业:了解ajax加载通过chrome的开发者工具,监控网络请求,并分析用selenium完成爬虫具体流程如下: 用selenium爬取https://news.qq.com/ 的热点精选原创 2020-05-29 14:52:07 · 219 阅读 · 0 评论 -
Datawhale第十二期组队学习--Python爬虫编程实践 Task03:session和cookie、代理、selenium自动化 拔高:丁香园留言板爬取
一. session和cookie常用的 web 容器有 Nginx 、 Apache 、 Tomcat 、Weblogic 、 Jboss 、 Resin 等等http 1.0HTTP1.0的特点是无状态无链接的无状态就是指 HTTP 协议对于请求的发送处理是没有记忆功能的,也就是说每次 HTTP 请求到达服务端,服务端都不知道当前的客户端(浏览器)到底是一个什么状态。客户端向服务端发...原创 2020-04-25 22:28:16 · 435 阅读 · 0 评论 -
Datawhale第十二期组队学习--Python爬虫编程实践 Task02:bs4、xpath和正则表达式re
一. Beautiful Soup缺点:基于HTML DOM 的,会载入整个文档,解析整个DOM树,因此时间和内存开销都会大很多,所以性能要低于lxml。匹配效率还是远远不如正则以及xpath的,一般不推荐使用,推荐正则的使用。...原创 2020-04-23 22:06:55 · 884 阅读 · 0 评论 -
Datawhale第九期组队学习--数据结构与算法(上)Task05:字符串(2天)
理论部分用数组实现一个顺序的串结构。为该串结构提供丰富的操作,比如插入子串、在指定位置移除给定长度的子串、在指定位置取子串、连接串、串匹配等。练习部分无重复字符的最长子串https://leetcode-cn.com/problems/longest-substring-without-repeating-characters/给定一个字符串,请你找出其中不含有重复字符的最长子...原创 2020-01-14 22:31:13 · 122 阅读 · 0 评论 -
Datawhale第九期组队学习--数据结构与算法(上)Task04:队列(2天)
理论部分用数组实现一个顺序队列。用数组实现一个循环队列。用链表实现一个链式队列。循环队列什么意思?练习部分模拟银行服务完成程序代码。目前,在以银行营业大厅为代表的窗口行业中大量使用排队(叫号)系统,该系统完全模拟了人群排队全过程,通过取票进队、排队等待、叫号服务等功能,代替了人们站队的辛苦。排队叫号软件的具体操作流程为:顾客取服务序号当顾客抵达服务大厅时,前往放置在入口...原创 2020-01-13 20:35:14 · 215 阅读 · 0 评论 -
Datawhale第九期组队学习--数据结构与算法(上)Task03:栈与递归(2天)
理论部分用数组实现一个顺序栈。用链表实现一个链栈。理解递归的原理。练习部分根据要求完成车辆重排的程序代码假设一列货运列车共有n节车厢,每节车厢将停放在不同的车站。假定n个车站的编号分别为1至n,货运列车按照第n站至第1站的次序经过这些车站。车厢的编号与它们的目的地相同。为了便于从列车上卸掉相应的车厢,必须重新排列车厢,使各车厢从前至后按编号1至n的次序排列。当所有的车厢都按照这种次...原创 2020-01-10 17:03:22 · 189 阅读 · 0 评论 -
Datawhale第九期组队学习--数据结构与算法(上)Task02:顺序表和链表(2天)
理论部分理解线性表的定义与操作。实现顺序表。实现单链表、循环链表、双向链表。练习部分合并两个有序链表https://leetcode-cn.com/problems/merge-two-sorted-lists/将两个有序链表合并为一个新的有序链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。示例:输入:1->2->4, 1->3->4...原创 2020-01-08 22:19:43 · 145 阅读 · 0 评论 -
Datawhale第九期组队学习--数据结构与算法(上)Task01:数组(1天)
理论部分理解数组的存储与分类。实现动态数组,该数组能够根据需要修改数组的长度。练习部分以下用python实现:利用动态数组解决数据存放问题编写一段代码,要求输入一个整数N,用动态数组A来存放2~N之间所有5或7的倍数,输出该数组。#!/usr/bin/pythontargetList = []n = input('请输入一个整数:N=')try: n = in...原创 2020-01-06 16:25:49 · 143 阅读 · 0 评论