Minions__-CSDN博客

原创 B站弹幕评论抓取

B站弹幕评论抓取#!/usr/bin/env python# -*- coding:utf-8 -*-# @Author: Minions# @Date: 2021-04-28 10:59:25# @Last Modified by: Minions# @Last Modified time: 2021-04-28 21:15:36import requestsfrom lxml import etreeimport reimport jsonimport timeimport

2021-04-28 21:25:48 2097 1

原创 pytorch官方demo(Lenet)学习笔记

pytorch官方demo(Lenet)学习笔记讲解一个pytorch官方的demo实例（搭建Lenet并基于CIFAR10训练）视频讲解来源：https://www.bilibili.com/video/BV187411T7Yeup主的代码和ppt：https://github.com/WZMIAOMIAO/deep-learning-for-image-processing一、项目简介model.py ——构建一个LeNet网络模型train.py ——加载数据集并训练模型predict.

2021-04-10 23:19:18 506

原创 Python猜数字小游戏

Python猜数字小游戏""" Guess a number within a range"""from random import randintstart = 1end = 100# 生成start到end的随机整数value = randint(start, end)# print(value)print("I'm thinking of a number between", start, "and", end)guess = None# 限制猜数字的次数lim

2021-04-03 22:46:33 334 1

原创 win10下MySQL的使用

一、MySQL安装windows10上安装mysql（详细步骤）注:如果安装在Starting the server卡住,可能是以前安装过有痕迹没有删除的，要在注册表删除 SQL server 删除注册表二、MySQL简介1.什么是数据库？数据库（Database）是按照数据结构来组织、存储和管理数据的仓库。每个数据库都有一个或多个不同的 API 用于创建，访问，管理，搜索和复制所保存...

2020-01-04 17:18:27 537

原创有界面的python音乐播放器（可下载音乐）

tkinter+pygame+spider实现音乐播放器1.确定页面SongSheet ------ 显示歌单MusicCtrl ------显示音乐一些控件(播放,跳转,音量调节)SearchWindows ------搜索栏(搜索歌曲默认显示20条,可下载)songSheet.py#!/usr/bin/env python# -*- coding:utf-8 -*-...

2019-12-17 23:21:18 3322 9

原创利用treelib库模拟文件管理系统

利用treelib库模拟文件管理系统treelib官方文档1.建立对象Interface 界面类MultiTree 多叉树类interface.py#!/usr/bin/env python# -*- coding:utf-8 -*-# @Author: Minions# @Date: 2019-12-6 9:10:38# @Last Modified by: Mi...

2019-12-10 22:00:34 376

原创 treelib详细介绍

treelib的主要功能包括：节点搜索的有效操作，O（1）。支持常见的树操作，如遍历，插入，删除，节点移动，浅/深复制，子树剪切等。支持用户定义的数据有效负载以加快模型构建。漂亮的树显示和text / json转储，用于漂亮的显示和离线分析。与Python 2和3兼容。官方文档：treelib...

2019-12-06 10:36:14 3156

原创 os模块常用命令

os模块常用命定import os""" os 模块提供了非常丰富的方法用来处理文件和目录"""# 获取操作系统类型 nt->windows posix->linux、unix或Mac OS Xprint(os.name)# 获取操作系统所有的环境变量# print(os.environ)# 获取指定环境变量print(os.environ.get(...

2019-12-03 21:27:55 277

原创 python读写csv文件

逗号分隔值（Comma-Separated Values，CSV，有时也称为字符分隔值，因为分隔字符也可以不是逗号），其文件以纯文本形式存储表格数据（数字和文本）读取csv文件csv.reader(csvfile, dialect=‘excel’, **fmtparams)返回一个读者对象，该对象将遍历给定csvfile中的行。 csvfile可以是支持迭代器协议并在每次__next__()...

2019-12-03 12:02:36 439

原创 python银行自动取款机系统详写

1.确定对象与方法人类名: Person属性: 姓名身份证号电话号卡行为:卡类名: Card属性: 卡号密码余额行为:银行主程序类名: Bank属性:行为: 用户列表提款机提款机类名: ATM属性: 用户字典行为: 开户查询取款存储转账改密锁定解锁补卡销户管理员界面类名: A...

2019-12-01 21:48:03 2929 4

原创 python面向对象编程

类(Class): 用来描述具有相同的属性和方法的对象的集合。它定义了该集合中每个对象所共有的属性和方法。对象是类的实例。方法：类中定义的函数。类变量：类变量在整个实例化的对象中是公用的。类变量定义在类中且在函数体之外。类变量通常不作为实例变量使用。数据成员：类变量或者实例变量用于处理类及其实例对象的相关的数据。方法重写：如果从父类继承的方法不能满足子类的需求，可以对其进行改写，这个过程...

2019-12-01 20:26:34 230

原创多线程爬虫（生产者消费者模式）

常规爬虫# -*- coding:utf-8 -*-import requestsfrom lxml import etreefrom urllib import requestimport osimport redef parse_page(url): headers = { "user-agent": "Mozilla/5.0 (Windows NT ...

2019-08-22 21:51:36 1304 1

原创使用 pyecharts 以及matplotlib分析猫眼哪吒影评

Geo函数参数源码解析def __add(self, name, attr, value, type="scatter", maptype='china', symbol_size=12, border_color="#111", geo_normal_co...

2019-08-14 17:26:43 715

原创 python生成词云图

数据准备，猫眼评论爬取了大概50多万条数据，详细请看# -*- coding:utf-8 -*-import re # 正则表达式库import collections # 词频统计库import numpy as np # numpy数据处理库import jieba # 结巴分词import wordcloud # 词云展示库from PIL import Imag...

2019-08-13 21:35:17 327

原创 XPath介绍与使用

XPath简介：XPath即为XML路径语言（XML Path Language），它是一种用来确定XML文档中某部分位置的语言,简单的来说，就是定位元素的位置百科XPath谷歌浏览器安装xpath helper插件xPath helper是一款Chrome浏览器的开发者插件，安装了xPath helper后就能轻松获取HTML元素的xPath，程序员就再也不需要通过搜索html源代码，定...

2019-08-10 17:44:17 580

原创 Selenium+chromedriver获取动态数据

动态数据需要手动刷新，或者直接分析接口，但是有的接口分析复杂度高，这个时候我们可以利用Selenium帮我们完成什么是Selenium：Selenium相当于是一个机器人。可以模拟人类在浏览器上的一些行为，自动处理浏览器上的一些行为，比如点击，填充数据，删除cookie等。chromedriver是一个驱动Chrome浏览器的驱动程序，使用他才可以驱动浏览器。当然针对不同的浏览器有不同的dri...

2019-08-09 21:54:53 3810

原创 selenium采集1688简单信息

1688信息采集首先进入1688可以看见多种类别信息我们选择其中的一种，例如选择女装之后，又会有很多的类别将类别保存到列表，方便下面继续运行detail_urls = []categories = driver.find_elements_by_xpath("//div[@class='ch-menu-item']/div[@class='ch-menu-item-list']/u...

2019-08-08 08:51:38 1694

原创 cookie信息登录

cookiecookie是什么？在网站中，http请求是无状态的。也就是说即使第一次和服务器连接后并且登录成功后，第二次请求服务器依然不能知道当前请求是哪个用户。cookie的出现就是为了解决这个问题，第一次登录后服务器返回一些数据（cookie）给浏览器，然后浏览器保存在本地，当该用户发送第二次请求的时候，就会自动的把上次请求存储的cookie数据自动的携带给服务器，服务器通过浏览器携带的数...

2019-08-03 20:36:46 1221

原创 ProxyHandler处理器（代理设置）

代理ip使用代理IP，这是爬虫/反爬虫的第二大招，通常也是最好用的。很多网站会检测某一段时间某个IP的访问次数(通过流量统计，系统日志等)，如果访问次数多的不像正常人，它会禁止这个IP的访问。所以我们可以设置一些代理服务器，每隔一段时间换一个代理，就算IP被禁止，依然可以换个IP继续爬取。在urllib.request库中，通过ProxyHandler来设置使用代理服务器，下面通过例子来说...

2019-08-03 11:53:20 288

原创 urllib库

urllib库Python做爬虫的优点Python生态极其丰富，诸如Request、Beautiful Soup、Scrapy、PySpider等第三方库实在强大Python语法简洁易上手，分分钟就能写出一个爬虫（有人吐槽Python慢，但是爬虫的瓶颈和语言关系不大）urllib库是是Python中一个最基本的网络请求库。可以模拟浏览器的行为，向指定的服务器发送一个请求，并可以保存服务...

2019-08-02 20:16:22 341

原创 selenium配置ip代理和无头selenium

配置ip代理# -*- coding:utf-8 -*-from selenium import webdriverproxy = 192.168.3.9:8925chrome_options= webdriver.ChromeOptions()chrome_options.add_argument('--proxy-server={0}'.format(proxy))driver...

2019-08-01 22:07:09 980

原创文件夹下多个文件夹下的csv文件合并

# -*- coding = utf8 -*-import osimport csvinput_path = input("请输入文件夹的路径:")files = os.listdir(input_path) #返回指定的文件夹包含的文件或文件夹的名字的列表。这个列表以字母顺序print(files)csvx_list = []# 筛选文件for f in files: ...

2019-07-14 22:01:27 1336 2

原创 python数组实现简单的推箱子

python数组实现简单的推箱子一、基本思路功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入环境：Windows10 ...

2019-06-14 23:25:21 12246 4

weixin_43512511的博客