![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
jgzquanquan
这个作者很懒,什么都没留下…
展开
-
爬虫入门
爬虫入门1. 概述本文首先介绍Requests库如何自动爬取HTML页面以及如何自动网络请求提交,随后将会讲解如何阅读网络爬虫排除标准。获取了网页之后用BeautifulSoup库解析HTML页面,然后讲解正则表达式,以及如何用正则表达式提取网页关键信息。当然会有很多实战内容如下:• 京东商品页面的爬取• 亚马逊商品页面的爬取• 百度/360搜索关键字提交• 网络图片的原创 2017-11-13 17:19:12 · 9953 阅读 · 4 评论 -
股票数据定向爬虫
实例3:股票数据定向爬虫(1) 目标:获取上交所和深交所所有股票的名称和交易信息新浪股票:http://finance.sina.com.cn/stock/百度股票:https://gupiao.baidu.com/stock/选取原则:股票信息静态存在于HTML页面中,非js代码生成没有Robots协议限制选取方法:浏览器 F12,源代码查看等选取心态:不要纠结于某原创 2017-11-14 13:12:53 · 3057 阅读 · 10 评论 -
淘宝商品价格定向爬虫
淘宝商品价格定向爬虫(1) 目标:获取淘宝搜索页面的信息,提取其中的商品名称和价格要实现淘宝的搜索接口,翻页的处理。主要采用了Requests,bs4库,re库(2)程序的结构设计:步骤1:提交商品搜索请求,循环获取页面 getHTMLText() def getHTMLText(url): try: r = reque原创 2017-11-14 12:45:33 · 4353 阅读 · 1 评论 -
中国大学排名定向爬虫(实例1)
中国大学排名定向爬虫:(1) 爬取网址:http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html(2) 程序的结构设计:步骤1:从网络上获取大学排名网页内容 getHTMLText() def getHTMLText(url): try: r = requests.get(url,原创 2017-11-13 18:43:33 · 1738 阅读 · 0 评论 -
灌水(python实现)
灌水Time limit per test: 1.0 secondsMemory limit: 256 megabytes时间转眼来到了 ECNU 校赛的前夜,ECNU 校赛命题组在紧锣密鼓地进行最后的题目测试以及题目顺序安排,然而在重新看了一遍题目之后,cdm 发现,大一的题目太难了,于是他准备去掉一道中档构造题并换上两道简单题,也就是灌水。ECNU 校赛总共原创 2017-07-13 11:15:38 · 807 阅读 · 0 评论 -
kmeans算法(python实现)
import numpy as npimport matplotlib.pyplot as plt#Initialize center函数通过使用numpy库的 zeros函数和random.uniform函数,随机选取 了k个数据做聚类中心,# 并将结果存放在 了k个数据做聚类中心,并将结果存放在 Numpy的Array对象centers中def InitCenters(dataSet,原创 2017-07-03 11:04:29 · 1280 阅读 · 0 评论 -
求N!的十进制表示中末尾0的个数 (python实现)
问题1,求N!的十进制表示中末尾0的个数。直接求出N!不太现实,很容易溢出。这个问题比较容易想到的是,因为2X5=10,所以可以求N!含有的因子2和因子5的个数。可以这样表示N!=2x * 3y * 5z * 7a*...,在这个表达式中,我们容易得出x > z,因此只需要计算N!中含有因子5的个数,进而可以转化成计算1-N这N个数含有因子5的个数之和下面的算法就需要好好考虑如原创 2017-07-11 20:27:17 · 2094 阅读 · 0 评论 -
因子平方和(python实现)
因子平方和Time limit per test: 1.0 secondsMemory limit: 256 megabytes给定一个整数 n(1n≤100),计算n 的所有因子(不包括 1 与自身)的平方和。例如:输入 n 的值为 56,56 的因子有:2,28,4,14,7,8,所有因子的平方和为 111原创 2017-07-10 20:15:13 · 1874 阅读 · 0 评论 -
N!进制转化为10进制
问题描述:n! 进制是指从数的最低位开始,第 i 位的权值是 (i+1)!,第i 位取值范围为 0~i+1,i 从 0 开始。例如:n! 进制的 21 对应10进制的 5, 计算方法为:2×2!+1×1!=5。n! 进制的 120 对应10进制的 10,1×3!+2×2!+0×1!=10py原创 2017-07-10 18:07:07 · 381 阅读 · 0 评论 -
十进制转 n! 进制(python实现)
n! 进制Time limit per test: 1.0 secondsMemory limit: 256 megabytesn! 进制是指从数的最低位开始,第 i 位的权值是 (i+1)!,第i 位取值范围为 0~i+1,i 从 0 开始。例如:n! 进制的 21 对应10进制的 5, 计算原创 2017-07-10 18:01:52 · 2979 阅读 · 0 评论 -
Problem #3288 成绩计算(python实现)
成绩计算Time limit per test: 1.0 secondsMemory limit: 256 megabytes编写一个程序,输入全班同学某门课考试成绩,找出其中最高分和最低分并计算平均成绩。Input第1行输入一个整数T(1≤T≤10),表示测试数据组数。接下来T行,每行输入全班同学的成绩(成绩取值范围为0~100),以一个特殊的数据原创 2017-06-30 15:24:59 · 1879 阅读 · 0 评论 -
统计文章词频(python实现)
统计出文章重复词语是进行文本分析的重要一步,通过本文将讲述如何用python3.6版本实现英文文章词频的统计原创 2017-06-29 12:24:00 · 10918 阅读 · 0 评论 -
3273 章鱼哥没有日历(Pyhton实现)
章鱼哥没有日历Time limit per test: 1.0 secondsMemory limit: 256 megabytes一月到十二月,这种无聊的东西,对于章鱼哥这种神奇的生物来说,当然是没有意义的。对于章鱼哥来说,只有年和日,没有月。他只关心某一天是这一年的第几天。如果你要告诉它华东师范大学的校赛将在 2017 年 5 月 20 日举行,他就原创 2017-06-28 20:47:37 · 575 阅读 · 0 评论 -
3262:黑心啤酒厂(Python实现)
问题描述:黑心啤酒厂Time limit per test: 1.0 secondsMemory limit: 256 megabytes黑心啤酒厂为了让大家买啤酒,会把一瓶酒设计成恰好能倒七杯。由于聚会时经常会有大家一起干杯这样的事情,干杯之前又要给每个人都倒满,所以来两个人的时候,干完三轮,恰好多一杯;三个人的时候,干完两轮,恰好多一杯;四个人的时候会多三杯原创 2017-06-28 19:18:44 · 375 阅读 · 0 评论 -
项目 1: 预测波士顿房价
Machine Learning Engineer NanodegreeModel Evaluation & ValidationProject 1: Predicting Boston Housing PricesWelcome to the first project of the Machine Learning Engineer Nanodegree! In this原创 2018-01-08 15:14:21 · 2543 阅读 · 0 评论