关闭

数学题

寻找质数: for num in range(10,500): for i in range(2,num): if num%i == 0: j = num/i print ('%d = %d x %d' % (num,i,j))#格式可借鉴,用%连接。 break #跳出本循环 else:...
阅读(65) 评论(0)

matplotlib函数

matplotlib函数import matplotlib.pyplot as plt plt.plot(x, y, fortmat_string, **kwargs) 参数说明: ·x,y是数值列表 ·fortmat_string:颜色字符、风格字符、标记字符(可选) ·kwargs:(统一修改) linestyle='dashed'--线型;color='green'--颜色;marker='o...
阅读(30) 评论(0)

Numpy数组

1、列表和数组:列表数据类型可以不同;数组的数据类型相同 2、N维数组对象:ndarray Python已有列表类型,为什么需要一个数组对象(类型)? • 数组对象可以去掉元素间运算所需的循环,使一维向量更像单个数据 • 设置专门的数组对象,经过优化,可以提升这类应用的运算速度 • 数组对象采用相同的数据类型,有助于节省运算和存储空间3、N维数组对象:ndarray ndarray是一...
阅读(39) 评论(0)

CD数据分析

import pandas as pd import numpy as np import matplotlib.pyplot as plt%matplotlib inline plt.style.use('ggplot')columns = ['UID','order_dt','product','amount'] df = pd.read_csv(r'C:\Users\shanminghuo\D...
阅读(24) 评论(0)

爬取当当网图书图片

import requests from bs4 import BeautifulSoup import redef getHTMLText(url): try: r = requests.get(url) r.encoding = r.apparent_encoding r.raise_for_status() return...
阅读(28) 评论(0)

merge, datime64

merge函数使用: http://pandas.pydata.org/pandas-docs/stable/merging.htmltimestamp解释:瘳雪峰Datetimes and Timedeltas: https://docs.scipy.org/doc/numpy/reference/arrays.datetime.html timedelta64帮助完善Datetimes功能...
阅读(32) 评论(0)

数据分析

import pandas as pd import numpy as np import matplotlib.pyplot as plt%matplotlib inline plt.style.use('ggplot')columns = ['UID','order_dt','product','amount'] df = pd.read_csv(r'C:\Users\think\Desktop...
阅读(28) 评论(0)

datetime

一、pandas库中的to_datetime函数:pandas.to_datetime: pandas.to_datetime(arg, errors=’raise’, dayfirst=False, yearfirst=False, utc=None, box=True, format=None, exact=True, unit=None, infer_datetime_format=Fals...
阅读(37) 评论(0)

爬取天气数据

第一次用旧知识爬取天气网站数据。import requests from bs4 import BeautifulSoup import bs4def getHTMLText(url): try: r = requests.get(url) r.raise_for_status() r.encoding = r.apparent_encodin...
阅读(41) 评论(0)

正则表达式

常用操作符: 正则表达式表达类型:原生字符串类型(不包含转义符的字符串,即\;可在字符串前加r,如:r’text’re 库函数: re库的另一种用法:编译后多次操作 pattern = re.compile(r’[1-9]\d{5}’) rst = pattern.search(‘BIT 100081’)match对象: 最小匹配: re库默认贪婪匹配,即输出匹配最长的子...
阅读(55) 评论(0)

大学排名信息爬取

import requests from bs4 import BeautifulSoup import bs4def getHTMLText(url): try: r = requests.get(url) r.raise_for_status() r.encoding = r.apparent_encoding return...
阅读(56) 评论(0)

format函数

format 函数可以接受不限个参数,位置可以不按顺序>>>"{} {}".format("hello", "world") # 不设置指定位置,按默认顺序 'hello world'>>> "{0} {1}".format("hello", "world") # 设置指定位置 'hello world'>>> "{1} {0} {1}".format("hello", "world")...
阅读(59) 评论(0)

BeautifulSoup0929

Beautiful Soup类基本元素: 例、… …:标签Tag ‘p’:标签名字name class=”title”:属性Attributes,通常以键值对形式出现 标签内非属性字符串NavigableString 标签内字符串注释部分CommentBeautifulSoup库: 引用方式:from bs4 import BeautifulSoup...
阅读(41) 评论(0)

Requests20170928

HTTP协议: URL格式:http://host:port[path] host:合法的Internet主机域名或IP地址 path:请求资源的路径URL是通过HTTP协议存取资源的Internet路径。requests库的主要方法: 1、r = requests.request():构造一个请求,支撑以下各方法的基础方法 2、r = requests.get():获取HTML网页的主要...
阅读(40) 评论(0)

pandas数据分析0723

import pandas as pd import numpy as np df = pd.read_csv(r"C:\Users\Administrator\Desktop\python 0712\DataAnalyst.csv",encoding = 'gb2312') df.head() len(df.positionId.unique()) df_duplicates = df.dro...
阅读(44) 评论(0)

淘宝商品数据爬取

import requests import re def getHTMLText(url): try: r = requests.get(url,timeout = 30) r.raise_for_status() r.encoding = r.apparent_encoding return r.text exc...
阅读(66) 评论(0)
    个人资料
    • 访问:685次
    • 积分:152
    • 等级:
    • 排名:千里之外
    • 原创:15篇
    • 转载:1篇
    • 译文:0篇
    • 评论:0条
    文章存档