python抓取微信公众号文章【基于Fiddler抓包】 本篇文章介绍一种通过抓包的形式来获取公众号文章,主要是抓包PC端的微信公众号文章,比较容易上手,只要用过抓包软件一般都不难的。这里使用Fiddler 4抓包软件,很常用的一款软件,也满足我们的要求了。准备工作- 抓包软件[Fiddler 4传送门](https://www.telerik.com/download/fiddler/fiddler4)- 使用Fiddler4安装好Fidd...
python爬虫---酷安(安卓app的聚集地) 酷安最近app用荒了,想要看看有些哪些好玩的app可以安装下来玩玩,酷安就是安卓应用的聚集地网页内容模块import requests--网页请求import time--延时import traceback--输出异常from multiprocessing import Pool--多进程from lxml import etree--解析数据from pymysql i...
191. Number of 1 Bits 191. Number of 1 Bits题目链接https://leetcode.com/problems/number-of-1-bits/原文内容Write a function that takes an unsigned integer and return the number of '1' bits it has (also known as the Hamming wei...
1009. Complement of Base 10 Integer 1009. Complement of Base 10 Integer这是一道LeetCode上面的Easy题目,原文连接:https://leetcode.com/problems/complement-of-base-10-integer/原文描述Every non-negative integer N has a binary representation. For example,...
Java基础--基于链表实现栈 栈是一种基本数据结构,后进先出,对栈的操作都是在栈顶进行的,值得我们去学习,有很多算法问题都能用栈来实现,如LeetCode里面的括号问题的匹配就能用栈来实现。本文是基于上篇文章说的链表进行栈的实现定义的栈的接口public interface Stack<T> { //获取栈中的元素个数 int getSize(); //判断栈是否为空 boolean isEmpty()...
Java基础--单链表的实现 Java内部也有自己的链表--LinkedList,但是我们今天不是讨论LinkedList,而是自己来实现一个单链表,包括简单的增删查改,以及使用链表来实现栈和队列这两种数据结构,涉及的方面如下: 单链表的结构 单链表的基本操作 使用虚拟头结点的单链表 单链表实现栈 单链表实现队列 单链表的结构 一种链式存取的数据结构,单链表中的数据是以结点的形式存在,每一个结点...
java基础---基于数组实现栈 public class ArrayDynamic {private E[] data;private int size;//有参构造函数,根据传入参数构造数组的容量public ArrayDynamic(int capacity){this.data = (E[]) new Object[capacity];this.size = 0;}//无参构造函数,默认数组的容量为10p...
java基础---数组的数据结构 引言在学习JAVA的基础的时候,我们只是简单的学习了数组的定义和怎么访问数组的元素,而且JAVA内部也替我们实现了数组的基本操作,我们没有过多的去考虑数组底层实现,所以本篇文章主要讲有关于数据结构里面的数组的基本操作,不会利用JAVA数组本身实现的操作,我们自己实现这些内部的底层。数组的定义数组是相同类型的 、用一个标识符名称来封装到一起的一个对象序列或基本类型的数据序列;也就是说数组充当一...
What's a Perfect Power anyway? 题目:完美的幂指数题目描述:A perfect power is a classification of positive integers:In mathematics, a perfect power is a positive integer that can be expressed as an integer power of another positive intege...
Help the bookseller Help the bookseller 题目:帮助书店题目描述A bookseller has lots of books classified in 26 categories labeled A, B, ... Z. Each book has a code c of 3, 4, 5 or more capitals letters. The 1st letter of a cod...
python爬虫----汽车之家的汽车论坛的最新精华帖 模块import requests---网页请求 import re---正则表达式 from bs4 import BeautifulSoup as bs---节点处理抓取的内容这次主要抓取汽车之家的汽车论坛里面的最新精华帖的内容,具体抓取帖子文字。url:https://club.autohome.com.cn/bbs/thread/71c8ec6ecd2ea90b/781079...
python爬虫----猫眼电影:最受期待榜 看一下猫眼的最受期待榜,了解大家都在期待什么样的电影,所以抓取数据来汇总。模块requests--->用于请求 re---->正则表达式的使用 os---->用于处理目录 csv---->用于csv文件的读写 bs4---->获取网页响应的节点信息 pandas--->读取csv文件 pyecharts import Line---->...
Valid Phone Number Coderswar刷题第二波一、Valid Phone Number题目描述: Write a function that accepts a string, and returns true if it is in the form of a phone number. Assume that any integer from 0-9 in any of the spots wil...
Highest and Lowest && Find the stray number 一、Highest and Lowest首刷java题目,题目如下:In this little assignment you are given a string of space separated numbers, and have to return the highest and lowest number. Example: HighAndLow("1 2 3 4 5")...
Coderwars使用 前言程序=算法+数据结构,没有算法的程序只能算是代码的堆砌,好的算法往往能提高你代码的效率,毕竟这是一个快时代。需要刷题的小伙伴可以到Coderwars网站进行,里面支持蛮多的编程语言的,有关编程的网站挺多,现在安利一下Coderwars,对该网站进行说明和使用。网站网站的网址为:https://www.codewars.com,是一个全英的网站,就算不刷题也得来看看英语呀,提高一下英...
Python---喜马拉雅fm的音频爬取 前言眼睛看惯了文字,累了 ,转而用耳朵去聆听这世界。喜马拉雅FM,这里有我们想听的,用爬虫去抓取我们想要的音频!这次要抓取的是关于旅游篇当中的玩转西藏【旅游攻略】,去感受高原的风土人情,废话并不多说啦。环境win10+python3.7+sublime text导包import requests---->网页的请求和数据抓取import json--->数据格式...
Apache---DbUtils组件的使用 DbUtils组件commons-dbutils 是 Apache 组织提供的一个开源 JDBC工具类库,它是对JDBC的简单封装,并且使用dbutils能极大简化jdbc编码的工作量,同时也不会影响程序的性能!下载jar包jar包:http://mirrors.shu.edu.cn/apache/commons/dbutils/binaries/dbutils的源码文件:http...
JDBC---元数据 元数据何为元数据?元数据为描述数据的数据,主要是描述属性的数据的信息。简单的说就是关于数据的数据。而在jdbc的学习中获取数据的定义,如数据库、表、列的定义信息,就要用到元数据。在jdbc中使用的元数据有三种:数据库元数据、参数元数据、结果集元数据。进行元数据的获取之前我们先来定义用来连接和关闭数据库的工具类。工具类public class JdbcUtils { private ...
Java--Apache里面的BeanUtils组件使用 BeanUtilsBeanUtils是Apache commens组件里面的成员,由Apache提供的一套开源api,用于简化对javaBean的操作,能够对基本类型自动转换。JavaBeanBeanUtils组件是用于简化javaBean的操作,那么什么是javaBean呢?简单来说,javaBean实质就是java类,只不过是遵循了某种规范的java类。javaBean的特点:...
python爬虫----b站的弹幕获取 这次逛到b站的音乐里面的我以歌声寄明月中的洛天依原创的《独醉宣月》,感觉是一首良曲,画风也很不错!所以就对它起了“歹徒之心”,而去把弹幕给获取来作词云。导包import requests-----网页请求import time-----延时操作import jieba----分词操作import numpy as np-----图片格式转换为数组from PIL impo...
python爬虫----全国天气预报的获取 这次是通过全国天气预报的网站去抓取实时天气和预测未来24小时的天气,抓取的数据包括:地区的区号、地区名称、实时气温、湿度、风向、风力、预测的最高温和最低温、晚间风向、日间的风向和各自的风力大小,把这些数据存储到mysql的数据库当中,并利用pygal库来对数据进行可视化操作。抓取的网页通过分析可以看到一个数据的接口,可以获取全国的地区码,或者点击地图上的区域也能找到 http://fo...
python爬虫实战---微信好友的获取 本次主要对微信好友的信息获取,包括微信备注名称、省份、城市、个性签名、性别,对其中的个性签名就行词云的制作和对性别的统计。由于微信好友城市分布不多,主要都是集中在一个地区,所以就做地区分布图也没有什么意义;数据存储到mysql当中。导入包from wxpy import Bot---微信机器人from PIL import Image---图片处理from wordcloud im...
python爬虫实战---网易云音乐评论抓取 本文主要是提取网易云音乐中歌曲的评论时间、评论者昵称、评论内容,并把数据写进csv文件里面,读取文件里面存储的评论内容,根据指定的背景图制作词云,抓取目标https://music.163.com/#/song?id=1299557768,2018年八月最热新歌TOP50中的Animal歌曲。引言网易云大厂一般都对自己的数据做了很好的加密,一般直接爬取都爬取不到数据,这也是爬取当中一个很头...
python爬虫实战---豆瓣电影top250的电影信息抓取 本文主要抓取豆瓣电影top250榜单里面的电影数据,提取的数据包括电影名称、电影的链接、电影的星级、电影引言、电影的评论 人数等。导入包from bs4 import BeautifulSoup as bs---进行网页解析import requests---用于网页请求import time---用于延长时间,防止过于快速抓取数据,封ipimport re---正则表达式使用...
python爬虫实战---今日头条的图片抓取 本文是主要在今日头条里面的以“街拍路人”为搜索条件去提取网页的图片和标题,并把标题当做文件夹的名称,创建该文件夹,把图片保存到相应的文件夹下。导入库from urllib.parse import urlencode---把字典里面的数据拼接成如下字符串格式:urlencode()的方法接受参数形式为:[(key1,value),(key2,value2),.....]或者可以是字典的...
python爬虫实战---猫眼电影:西虹市首富的评论抓取 本文旨在抓取电影的评论,包括电影评论者的昵称、来自的城市、评论内容、评分以及评论的时间,并将这些内容抓取下来保存到txt文本里面,并对其中的评论内容去重,并生成词云。导入库from urllib.error import HTTPError,URLError---异常处理from collections import defaultdict---创建列表from wordcloud i...
python实战---猫眼榜单:TOP100榜 本文将爬取猫眼电影的榜单里面的TOP100榜单,爬取的数据包括电影名称、链接、评分和上映时间,数据将保存到txt文件里面去,TOP100榜的url:http://maoyan.com/board/4?offset=0导入库BeautifulSoup---解析网页 urlopen---获取网页源码 HTTPError、URLError---异常处理 pygal---数据可视化的处理提...
python爬虫实战--爬取猫眼专业版-实时票房 小白级别的爬虫入门最近闲来无事,发现了猫眼专业版-实时票房,可以看到在猫眼上映电影的票房数据,便验证自己之前学的python爬虫,爬取数据,做成.svg文件。爬虫开始之前我们先来看看猫眼专业版-实时票房这个网页,看看我们要爬取的数据,分析网页的结构和查看源码。(1)网页链接:https://piaofang.maoyan.com/dashboard(2)爬取的数据:红框框里面的...
JAVA中的注解 注解(annotation),也叫元数据,它是jdk1.5版本及以后版本中引进来,它可以对类(type)、字段(field)、方法(method)、参数(parameter)、构造器(constructor)、局部变量(local_variable)进行说明,告诉编译器如何去运行程序。常用的注解有:@Deprecated,标记方法以及过时 @Override,重写父类的方法 ...
利用js来实现轮播图 由于现在很多网站都有轮播图的存在,所以自己的学着来捣鼓一下下,内容有点长! (1)、首先要先制作好html页面,利用div盒子来布局 <div id="box" class="all"> <div class="screen"> <ul> <li><img src
利用js来完成图片的放大 从小白的开始 请参考我的上传的资源:利用js来完成图片的放大,从小做起,希望能够和大家一起学习。(1)、先设置好页面,定一个最外面的盒子div,盒子里面放好两个div,第一个div里面放多一个div和图片标签,另一个div里面放一个图片的标签。设置好样式 (2)、position的说明:有几个值----absolute、relative、...