- 博客(34)
- 资源 (1)
- 收藏
- 关注
原创 Python中return的用法
在定义函数时,对于return的使用return语句是python语言中函数返回的一个值,每个函数都应该有一个返回值,其中,return返回值可以是一个数值,一个字符串,一个布尔值,一个列表,或者函数在Python中return函数返回值return,函数中一定要有return返回值才是完整的函数,如果你没有定义Python函数返回值,那么得到的结果是None对象。return ...
2019-01-24 21:09:51 28647 8
原创 怎样删除Github中的项目
我们在GitHub上创建项目的时候,如果想要删除当前项目,怎样进行操作呢,下面就简单介绍一下怎样去删除GitHub中的项目1、选择要删除的项目2、进入项目中的setting(设置)中3、一直下拉,看到有红色字体出现,进入Danger Zone中,选择Delete按钮4、输入完整的项目名称,如果不进行这一步,就无法删除项目5、以上步骤完成之后,直接点击下面删除按钮即可,这样一个GitHub中的项目就完整删除了...
2021-06-19 15:18:21 17966
原创 爬虫实战7:豆瓣影视爬取
文章目录前言 一、页面解析 二、代码展示 1.引入库 2.主要代码展示 总结前言一、页面解析示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。二、代码展示1.引入库2.主要代码展示代码如下(示例):总结...
2020-12-12 21:13:15 2174
原创 爬虫实战5:豆瓣读书爬取
# 模块安装import requestsfrom lxml import etreeimport csvimport timeimport random''''''ip = ['183.56.105.58:32589', '114.104.139.57:27936', '115.202.140.134:23752', '220.179.102.189:32593', '36.57.87.3:35902', '11...
2020-12-12 20:27:52 3447 1
原创 爬虫实战4:豆瓣的模拟登陆
系列文章目录一、pandas是什么?二、使用步骤 url_basic = 'https://accounts.douban.com/j/mobile/login/basic' url = 'https://www.douban.com/' ua_headers = {"User-Agent": 'Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.0; Trident/4.0)'} # basic中p..
2020-12-07 21:56:33 1618
原创 爬虫实战3:python分析数据分析师的‘钱‘景如何
随着近年来人工智能和大数据的火热,越来越多的人想要从事或转行数据分析师,大家对于此行业如此的热爱,主要原因就是薪资客观,有发展前景。以我浅薄的工作经验,来谈谈对数据分析师的看法,此行业一直存在一个争议,到底是工具重要还是业务水平重要,即工具党和业务党,先站队,我是业务党(以前是工具党)。虽然我大部分时间都在做数据处理工作,这个能力也是必须的,无论是简单的EXCEL,SQL,PPT还是复杂的R,Python,finebi,finereport,HIve都有涉及,但是市面上有太多的分析工具...
2020-11-22 18:14:09 248
原创 爬虫实战2:豆瓣电影TOP250
1、豆瓣简介豆瓣是一个社交网站,起源于2005年,该网站以书影音起家,提供关于图书、电影、音乐唱片的推荐、评价和价格比较,以及城市独特的文化生活。本篇文章将从数据分析的角度来分析豆瓣网站。分析的维度有书籍,书籍类目,书评,电影,电影类型,影评,音乐,音乐类型,音频,还有豆瓣产品介绍等等.....本篇文章将以豆瓣电影Top250排行来简要介绍爬虫技术和豆瓣电影2、爬虫开启需要爬取的网站页面如下所示,本次爬取的字段包含有排行,海报,电影名...
2020-11-22 18:08:22 1006 2
原创 python可视化1:matplotlib的介绍
官方网站 https://matplotlib.org/安装方法:pip install matplotlib 介绍 matplotlib是一个python的2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形,通过matplotlib,可以绘制折线图,散点图,柱形图,饼图,直方图,子图等等,matplot使用numpy进行数组运算,并调用一系列其他的python库来实现硬件交互。matplotlib是受MATLAB的启发构建的,...
2020-11-21 15:31:12 664
原创 数据分析实战1:淘宝数据分析
本文需要用到的数据分析包有pandas、numpy、matplotlib、jieba、seaborn数据分析的步骤: 数据预处理(去重、缺失值处理) 数据查看(找到有用的分析数据) 数据探索(依照数据给出探索出的结果) 数据预处理1、模块导入import pandas as pdimport numpy as npimport matplo...
2020-04-16 13:13:34 3185 3
原创 天猫商品评论情感词分析(基于SnowNLP)
简介SnowNLP是一个python写的类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于现在大部分的自然语言处理库基本都是针对英文的,于是写了一个方便处理中文的类库,并且和TextBlob不同的是,这里没有用NLTK,所有的算法都是自己实现的,并且自带了一些训练好的字典。而且SnowNLP非常适合商品评论的情感词分析。参考链接:https://github.co...
2020-04-06 21:52:53 2819 4
原创 python爬虫1:天猫评论的爬取(附词云解析)
废话少说,直接上干货选择的淘宝产品是olay官方旗舰店下的产品,点击到评价页面之后,打开网页源代码,找到评论的链接如下所示接下来就是爬取的过程了,找到链接:rate.tmall.com/list_det为了发现不同页数URL链接的区别,多选择几页rate.tmall.com/list_det随后你就会发现,变化的参数是currentPage,_ksTS,...
2020-04-04 10:59:01 5945 7
原创 SQL面试题(来自牛客网)
、查询最晚入职员工的基本信息#1、子查询的方式#先找出hire_date字段的最大值,在把该值当成条件来查找,还可以扩展为最早等其他限制条件select*fromemployeeswherehire_date=(selectmax(hire_date) from employees)#2、排序,降序#对hire_date字段排序降序,此时最晚的时间排在第一个,再用limi...
2020-04-01 17:04:05 593
原创 AttributeError: module 'jieba' has no attribute 'cut'
出现下面错误时候AttributeError: module 'jieba' has no attribute 'cut'解决的方法:在jieba模块安装的前提下.py文件可能为jieba.py,更改名字即可
2020-03-24 11:20:03 1956
原创 SyntaxError: Non-UTF-8 code starting with '\xe5' in file D:/spider/python错误解决
python执行出现以下错误的时候SyntaxError: Non-UTF-8 code starting with '\xe5' in file D:/spider/python模解决方式:在python#coding:utf-8
2020-03-24 11:17:31 5842 3
原创 解决数据排名问题——mysql中的窗口函数
对于SQL语句的使用,我们知道怎样使用它的增删改查,但是如果遇到这样的查询需求时,怎样得到各部门工资排名前N名员工列表,环比如何计算,查找各部门每人工资占部门工资的百分比。对于这写类型的查询需求,传统的查询语句解决起来非常的繁琐,但要解决此类问题,最方面的就是使用窗口函数。 窗口函数的定义什么是窗口函数,窗口的概念十分重要,可以理解为记录集...
2020-03-22 21:04:08 589 1
原创 mysql函数大全
mysql语句中有很多内置的函数,熟练的掌握这些函数可以让我们在工作是事半功倍,有助于了解mysql语句的精髓。下面简单介绍几种常见的函数。 字符串函数 数字函数 日期函数 高级函数 1、字符串函数1、ascII(s)返回字符串的第一个字符的ASCII码selectascii(columns)ascol1 from table_na...
2020-03-22 21:00:37 626
原创 mysql中的join语句详解
对于数据分析师而言在工作中最常用到的是MySQL中的查询功能,而在查询功能中比较常见的语句就是join连接语句,他可以通过不同表的连接来查找出想要的数据,常见的join语句主要有left join、inner join、full join、right join四种1、left joinleft join关键字会从左表那里返回所有的行,即使在右表中没有匹配的行语...
2020-03-22 20:55:10 1677
原创 pandas基础语句汇总
1、数据的导入方法pd.read_csv(csv文件) 从CSV文件导入数据pd.read_table(text文件) 从限定分隔符的文本文件导入数据pd.read_excel(excel文件) 从excel文件中导入数据pd.read_sql(sql语句,连接数据库) 从SQL表/库导入数据pd.read_json(json字符串) 从json格式的字符串导入数据2、...
2020-02-29 22:16:35 1367
原创 python中文件IO操作
文件读写是最常见的IO操作,python中内置了操作文件读写的函数,在读写文件前,我们先必须了解一下,在磁盘上读写文件的功能都是由操作系统提供的,现代操作系统不允许普通的程序直接操作磁盘,所以,读写文件就是请求操作系统打开一个文件对象(通常称为文件描述符),然后,通过操作系统提供的接口从这个文件对象中读取数据(读文件),或者把数据写入这个文件对象(写文件),本文将从下面三个方面介绍...
2020-02-24 14:52:36 369
原创 详解python中的面向对象
面向对象编程是最有效的软件编写方法之一,在面向对象编程中,你编写表示现实世界中的事物和情景的类,并基于这些类来创建对象编写类时,你定义一大类对象都自动具备这种通用的行为,然后可根据需要赋予每个对象独特的个性,使用面向对象编程可模拟现实情景,从而达到你想要达到的目的。本文将从面向对象中的类的实例、属性、方法、继承、多态多方面介绍python中的面向对象面向对象编程技术名词的...
2020-02-24 14:40:56 344
原创 python常用函数总结
python中目前含有68个内置函数,掌握这些内置函数可以让我们更好的处理问题,下面将分类介绍这些python的内置函数数学运算函数(7)类型转换函数(24)序列化操作函数(8)对象操作函数(8)判断操作函数(8)变量操作函数(2)交互操作函数(2)文件操作函数(1)编译执行函数(4)装饰器函数(3)数学运算函数(7)1、abs():返回数...
2020-02-20 18:19:38 550
原创 python函数详解
在python语句中函数占有很重要的地位,python中也提供了许多的内建函数,例如:input()、print()等,也可以自己去定义函数来调用。合理的使用函数可以帮助我们(1)提高编写的效率(2)提高代码的重用,避免反复写某一段代码(3)可以方便程序的编写、阅读、修改以及测试1、定义一个函数想要定义一个函数,首先必须遵守以下规则 函数代码块必须以d...
2020-02-15 15:43:05 556
原创 python中的画图神器——turtle模块使用
Turtle库是Python语言中一个简单流行的绘图函数库,使用非常方便,直接导入importtrutle即可turtle库的基础命令介绍1、画布画布cancas是绘图区域,可以设置它的大小和初始位置turtle.screensize(1000,600,'red') 大小的设置turtle.setup(width=0.5,height=0.75) 初始位置2...
2020-02-12 11:07:27 4980
原创 mysql中的时间处理函数
1、查找当前的时间select getdate()2、dateadd在向指定日期加上一段时间的基础上,返回新的datetime值select dateadd(day,2 or -2,getdate())3、datediff返回跨两个指定日期的日期和时间边界数select datediff(day,时间1,时间2)4、datepart返回代表指定日期的指定日期部分的整数...
2020-02-11 10:10:36 476
转载 一千行 MySQL 学习笔记
/* 启动MySQL */net start mysql/* 连接与断开服务器 */mysql -h 地址 -P 端口 -u 用户名 -p 密码/* 跳过权限验证登录MySQL */mysqld --skip-grant-tables-- 修改root密码密码加密函数password()update mysql.user set password=password('root...
2020-02-11 10:04:38 218
原创 pyhton面向对象的实例
面向对象的开发步骤面向对象分析:OOA:以分析对象及对象的行为为主面向对象设计:OOD:将分析的结果还原为代码面向对象编程:OOP:通过代码实现需求面向对象测试:OOT:运行测试功能流程'''python中面向对象的案例'''class Pet: '''定义一个宠物的类 ''' def __init__(self,nickname,health): ...
2019-02-13 17:56:58 363
原创 Python中数据类型转换的输入与输出
1、使用eval()函数的数据类型的转换#1. 将程序中的字典数据,转换成字符串存储到文件中users = {'admin': {'username': 'admin', 'password': '123'}}# 类型能否直接转换字符串?users_str = str(users)# 存储到文件中with open('./data/2.1.text', 'w') as file:...
2019-01-27 09:40:14 749
原创 文件的输入与输出
1、文件的读和写open() 将会返回一个 file 对象,基本语法格式如下:open(file, mode='r', buffering=None, encoding=None, errors=None, newline=None, closefd=True):filename:包含了你要访问的文件名称的字符串值。 mode:决定了打开文件的模式:只读,写入,追加等。所有可取值见...
2019-01-27 09:30:10 428
原创 Numpy的基础操作
Numpy是python数据科学计算的核心库,提供了高性能的多维数组对象及处理数组的工具创建数组 初始化占位符 输入/输出保存与载入磁盘上的文件 保存与载入文本文件数据类型 数组信息 调用帮助 数组计算算术运算 比较 聚合函数数组复制 数组排序 子集、切片、索引子集 切片 条件索引 花式索引数组操作转置数组 改变数组形状 添加或删除值 合并数组 ...
2019-01-25 21:02:07 496
原创 Python中字符串的操作
在python中字符串的操作是非常重要的,也是程序中最常见的数据类型,下面列出几种比较常见的操作。#1.首字母的大写(capitalize)name="jerry"print(name.capitalize())[out]:Jerry#2.字符串对齐('center','ljust','rjust')print(name.center(20))print(name.ljust(...
2019-01-24 18:38:08 260
原创 python中的组合数据类型——列表、元组、集合、字典
python中有四个组合数据,分别为列表、元组、集合、字典1、列表(list)类型:list特点:按照有顺序的方式储存多个可以重复的数据声明:分为空列表的声明和非空列表的声明#空列表的声明x=list()x=[]#非空列表的声明x=list([1,2,3])x=[1,2,3]列表的数据操作有增加、删除、修改、删除(1)列表的增加a=list([1,2,...
2019-01-22 20:25:14 1786
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人