Python
文章平均质量分 57
SCUTJcfeng
https://github.com/SCUTJcfeng
展开
-
Python 下载哔哩哔哩视频
Python 下载哔哩哔哩视频源码见Github 链接欢迎留言讨论说明支持按 Up 下载和按 av 号下载例子要下载凉风所有阅片无数的视频# up id,比如凉风 14110780UP_ID = 14110780# 关键词,如 KEYWORD = '阅片无数' 查看所有带有阅片无数标题的视频KEYWORD = '阅片无数'# 视频顺序,关联 up id 和 keywor...原创 2020-02-16 17:58:39 · 3368 阅读 · 0 评论 -
LeetCode:620. Not Boring Movies
题目: X city opened a new cinema, many people would like to go to this cinema. The cinema also gives out a poster indicating the movies’ ratings and descriptions. Please write a SQL query to output mo...原创 2018-04-19 17:49:18 · 222 阅读 · 0 评论 -
LeetCode:182. Duplicate Emails
题目: Write a SQL query to find all duplicate emails in a table named Person.+—-+———+ | Id | Email | +—-+———+ | 1 | a@b.com | | 2 | c@d.com | | 3 | a@b.com | +—-+———+ For example, your qu...原创 2018-04-19 21:08:44 · 205 阅读 · 0 评论 -
LeetCode:175. Combine Two Tables
题目: Table: Person+————-+———+ | Column Name | Type | +————-+———+ | PersonId | int | | FirstName | varchar | | LastName | varchar | +————-+———+ PersonId is the primary key colum...原创 2018-04-19 22:05:12 · 222 阅读 · 0 评论 -
LeetCode:181. Employees Earning More Than Their Managers
题目: The Employee table holds all employees including their managers. Every employee has an Id, and there is also a column for the manager Id.+—-+——-+——–+———–+ | Id | Name | Salary | ManagerId | ...原创 2018-04-19 23:30:12 · 225 阅读 · 0 评论 -
Python爬虫云服务器搭建系列之一:环境搭建
简介本文所用到的云服务器是阿里云:Ubuntu 16.04 64位。0x00:创建实例并启动服务器本节跳过0x01:登陆服务器工具:putty 安装putty后输入ip和port(默认22),连接类型选择SSH(默认),保存save session,下次直接进入。 完了后点击open 输入账号密码: 账号默认为root,密码可以到网页端ecs实例-更多-...原创 2018-04-24 11:47:08 · 4379 阅读 · 0 评论 -
中国裁判文书网爬虫分析
前言本篇主要分析文书网爬虫思路,仅供个人学习之用,切勿用于任何商业用途。分析一中国裁判文书网首页地址:http://wenshu.court.gov.cn/ 随便点击一下搜索,进入: 进入第一个结果: 注意圆圈中的下载按钮,点击下载,一个.docx格式的文档就安安稳稳的躺在你的电脑硬盘上了。 到这里初步分析结束,我们自然就想到了爬虫的内容: ...原创 2018-05-01 23:28:09 · 9770 阅读 · 8 评论 -
天猫评论爬取系列之Bra特别篇
天猫评论爬取系列之Bra特别篇(钢铁直男勿进)封面图镇楼~1 前言1.1 目的爬虫真是好玩:) 在一个阳光明媚的中午,刚吃完饭的我坐在电脑桌前,翻着手机,忽然看到这样一条微信公众号推送(图是后来截的): 嗯~ o( ̄▽ ̄)o,又可以涨知识了,开干吧(只看分析请跳到最后)。1.2 相关工具 Chrome:抓包、浏览器 scrapy:爬虫框...原创 2018-04-20 15:55:04 · 886 阅读 · 2 评论 -
Python爬虫云服务器搭建系列之二:环境搭建
前言上篇在这里: Python爬虫云服务器搭建系列之一:环境搭建本篇主要介绍阿里云的云服务器ECS和云数据库EDS,先贴配置图吧: 0x00:搭建过程在上一篇文章已经介绍了云服务器ECS的登陆和部分爬虫模块的安装,现在继续:网页端登陆控制台,到左侧选择云服务器RDS版,点击实例id,根据提示创建用户(因为只能创建这一个用户,所以我的截图没有这个提示); 点击数据...原创 2018-04-24 21:27:01 · 985 阅读 · 0 评论 -
LeetCode:183.Customers Who Never Order
题目: Suppose that a website contains two tables, the Customers table and the Orders table. Write a SQL query to find all customers who never order anything.Table: Customers.+—-+——-+ | Id | Name ...原创 2018-04-20 16:27:00 · 185 阅读 · 0 评论 -
LeetCode:197. Rising Temperature
题目: Given a Weather table, write a SQL query to find all dates’ Ids with higher temperature compared to its previous (yesterday’s) dates.+———+——————+——————+ | Id(INT) | RecordDate(DATE) | Temperat...原创 2018-04-20 17:17:55 · 184 阅读 · 0 评论 -
LeetCode:596. Classes More Than 5 Students
题目: There is a table courses with columns: student and classPlease list out all classes which have more than or equal to 5 students.For example, the table:+———+————+ | student | class | ...原创 2018-04-20 17:53:54 · 203 阅读 · 0 评论 -
LeetCode:196. Delete Duplicate Emails
题目: Write a SQL query to delete all duplicate email entries in a table named Person, keeping only unique emails based on its smallest Id.+—-+——————+ | Id | Email | +—-+——————+ | 1 | ...原创 2018-04-20 21:44:25 · 249 阅读 · 0 评论 -
插入Json数据到Mysql
前言MySQL 5.7已经原生支持JSON格式,我在插入Json数据的时候出错了,出错的过程记录一下。过程错误:Invalid JSON text: "Invalid escape character in string." at position...分析:原来是数据自带了'\r\n'这样的换行符号。用replace()替换掉对应的转义字符。延伸:escape cha...原创 2018-04-24 23:06:44 · 6694 阅读 · 0 评论 -
LeetCode:771. Jewels and Stones
题目: You’re given strings J representing the types of stones that are jewels, and S representing the stones you have. Each character in S is a type of stone you have. You want to know how many of th...原创 2018-04-20 23:24:40 · 361 阅读 · 0 评论 -
新浪GIF下载
前言最近偶然发现新浪动图的其中一个接口,就顺便写了一个脚本定时把动图拿下来。接口地址:https://interface.sina.cn/tech/gif/album.d.jsonKnown Issues:只能拿到最近的1000条数据代码块#!/usr/bin/python3# -*- coding:utf-8 –*-import osimport timeimport ...原创 2019-01-12 10:43:19 · 916 阅读 · 0 评论 -
Python Fabric模块介绍
前言最近有一个需求,需要在服务器执行命令,结果需要返回本地,中间涉及到配置文件的传输,一开始我想到的是Paramiko,后来联想起之前一段时间在公众号看到Fabric,便研究了一下,最后发现Fabric能优雅的完成我的需求,脚本已经开发完成,稳定运行了一段时间,现在总结一下。介绍Fabric官方文档:http://docs.fabfile.org/en/2.4/index.htmlFab...原创 2019-01-12 11:28:24 · 1441 阅读 · 0 评论 -
LeetCode:627. Swap Salary
题目: Given a table salary, such as the one below, that has m=male and f=female values. Swap all f and m values (i.e., change all f values to m and vice versa) with a single update query and no interme...原创 2018-04-19 17:33:00 · 269 阅读 · 0 评论 -
LeetCode:176. Second Highest Salary
题目: Write a SQL query to get the second highest salary from the Employee table.+—-+——–+ | Id | Salary | +—-+——–+ | 1 | 100 | | 2 | 200 | | 3 | 300 | +—-+——–+ For example, given t...原创 2018-04-19 17:15:22 · 245 阅读 · 0 评论 -
LeetCode:7. Reverse Integer
题目: Given a 32-bit signed integer, reverse digits of an integer.Example 1:Input: 123 Output: 321Example 2:Input: -123 Output: -321Example 3:Input: 120 Output: 21Note: Assume we are ...原创 2018-04-19 16:18:12 · 165 阅读 · 0 评论 -
Python 3.6 安装 Flask
pip install flask如果你跟我一样在安装MarkupSafe报错的话,请安装MarkupSafe的轮子(https://www.lfd.uci.edu/~gohlke/pythonlibs/#markupsafe)下载对应的轮子文件后,pip install MarkupSafe-1.0-cp36-cp36m-win32.whl我的是MarkupSafe-1.0-cp36-cp36m...原创 2018-03-09 13:49:00 · 3058 阅读 · 0 评论 -
Python 之 Duck Typing(鸭子类型)
一些例子来源于(http://www.voidspace.org.uk/python/articles/duck_typing.shtml#id8)我们常说,Python是动态语言,而鸭子类型又是动态语言的一种风格。其实,动态是相对于静态来说的。在C++、C #、Java等静态语言中,代码在编译时就已经可以知道变量的类型,方法返回的类型等等一切信息,而在静态语言中,往往要到程序执行的那一刻才知道变...原创 2018-03-09 14:50:12 · 599 阅读 · 0 评论 -
Flask入门之一:简单实现login功能
准备下列文件目录。新建一个文件夹(我命名为web);在web文件夹里面新建.py文件(我命名为page.py);在web文件夹里面新建templates文件夹(就叫templates)。准备完毕。准备flask_wtf模块。pip install flask_wtf在page.py文件中输入以下代码:from flask import Flaskfrom flask import render_...原创 2018-03-09 23:49:58 · 1566 阅读 · 0 评论 -
Python 的 import 机制
本文转载于https://loggerhead.me/posts/python-de-import-ji-zhi.html#_1一直对 Python 的 import 机制不甚了解,这次在写 Easy-Karabiner 的时候就踩坑了,顺便了解了一下,发现这玩意儿还不是那么「符合直觉」,遂写篇博客讲讲。模块与包两种形式的 importimport 的搜索路径相对 import 与 绝对 impo...转载 2018-03-10 22:55:46 · 871 阅读 · 0 评论 -
Scrapy学习系列之拉勾网爬虫实践
Scrapy Projects本项目为个人学习记录,会不定期挖坑更新 工具 版本 OS Windows 10 Python 3.6.4 Scrapy 1.5.0 Pycharm 2017.3.3 Fiddler v5.0.20173.50948 Google Chrome 65.0.3325.146...原创 2018-03-12 19:53:57 · 799 阅读 · 0 评论 -
Scrapy学习系列之Selenium + Chrome + Xpath实践记录
源代码见个人Github:https://github.com/SCUTJcfeng/ScrapyProjectslagouPCJobs本项目主要通过Selenium + Chrome + Xpath 爬取拉勾网职位列表,结果同样输出到CSV文件。Known Issue: 1. 会出现最后一页或者还不到最后一页时,停止翻页,但数据还在写入(endless),必须强制关闭程序,造成大量...原创 2018-03-13 17:23:03 · 1567 阅读 · 0 评论 -
Python self参数 & 函数详解
在介绍Python的self用法之前,先来介绍下Python中的类和实例…… 我们知道,面向对象最重要的概念就是类(class)和实例(instance),类是抽象的模板,比如学生这个抽象的事物,可以用一个Student类来表示。而实例是根据类创建出来的一个个具体的“对象”,每一个对象都从类中继承有相同的方法,但各自的数据可能不同。 1、以Student类为例,在Python中,定义类如下:cla...转载 2018-04-01 22:44:39 · 2945 阅读 · 0 评论 -
新浪微博生成词云
新浪微博生成Wordcloud(词云)1 前言1.1 目的本篇主要介绍新浪微博内容生成Wordcloud(词云),我举了一个炒鸡简单的例子。1.2 工具Wordcloud 词云(pip install wordcloud安装即可)jieba 分词(pip install jieba安装即可)1.3 相关网址 Wordcloud API Referenc...原创 2018-03-27 22:09:04 · 10183 阅读 · 0 评论 -
网易云音乐评论生成Wordcloud(词云)
网易云音乐评论生成Wordcloud(词云)1 前言1.1 目的本篇主要介绍网易云音乐爬取歌曲知足的评论生成词云,可以结合新浪微博生成词云学习。1.2 工具Wordcloud 词云(pip install wordcloud安装即可)jieba 分词(pip install jieba安装即可)第三方网易云API(需配合node.js食用):https://git...原创 2018-03-28 16:26:42 · 1915 阅读 · 0 评论 -
Redis在Ubuntu和Windows下的安装
Redis在Ubuntu和Windows下的安装过程前言今天(2018年4月21日),我在我的Ubuntu 17.10和Windows 10双系统都安装上了Redis,简单记录一下过程。一、windows下的安装:其实,redis官方最新版4.0.9已经不支持Windows,现在在微软的Github仓库上能找到最新的就是3.2.100,这是微软维护的最后一个版本。进入...原创 2018-04-21 23:48:46 · 608 阅读 · 0 评论 -
LeetCode:Two Sum
题目: Given an array of integers, return indices of the two numbers such that they add up to a specific target.You may assume that each input would have exactly one solution, and you may not use the ...原创 2018-04-18 14:58:58 · 274 阅读 · 0 评论 -
LeetCode:Reverse Linked List(单链表反转)
Question: Reverse a singly linked list.(单链表反转)Answer:(42ms)# Definition for singly-linked list.# class ListNode(object): # def __init__(self, x): # self.val = x # self.next =...原创 2018-04-18 16:27:18 · 278 阅读 · 0 评论 -
LeetCode:Add Two Numbers
题目: You are given two non-empty linked lists representing two non-negative integers. The digits are stored in reverse order and each of their nodes contain a single digit. Add the two numbers and ret...原创 2018-04-18 22:13:25 · 174 阅读 · 0 评论 -
LeetCode:665. Non-decreasing Array
题目: Given an array with n integers, your task is to check if it could become non-decreasing by modifying at most 1 element.We define an array is non-decreasing if array[i] <= array[i + 1] holds ...原创 2018-04-19 14:07:20 · 166 阅读 · 0 评论 -
Scrapy-redis学习系列之一:初识scrapy-redis
Scrapy-redis学习系列之一:初识scrapy-redis写在最前本项目Github地址:https://github.com/SCUTJcfeng/Scrapy-redis-Projects一、scarpy-redis介绍scrapy-reids官方介绍的三个特性如下:Distributed crawling/scraping(分布式爬虫)You ca...原创 2018-04-23 19:36:33 · 738 阅读 · 0 评论 -
Python高级特性之Generator
第一次写博客,排版格式什么的不是很熟悉,so,看内容就好了:)要说清楚什么是Generator(生成器),就要讲什么是Iterator(迭代器)。Iterator(迭代器)和Iterable(可迭代对象)什么是Iterator(迭代器)呢?Python官方解释如下:An iterator is an object that implements next, which is expected to...原创 2018-03-09 12:07:59 · 388 阅读 · 0 评论