python数据分析
!一直往南方开.
这个作者很懒,什么都没留下…
展开
-
京东爬虫与情感分析
紧接着上篇文章爬取京东商品的评论进行情感分析1.导入相关库# 导入requests库(请求和页面抓取)import requests# 导入time库(设置抓取Sleep时间)import time# 导入random库(生成乱序随机数)import random# 导入正则库(从页面代码中提取信息)import reimport osimport csv# 导入情感分...原创 2019-11-28 18:54:17 · 2305 阅读 · 1 评论 -
selenium自动化爬取京东电脑商品信息用于数据分析
今天使用selenium给别人写的一个自动化爬虫程序from selenium import webdriverfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium.webdriver.support import exp...原创 2019-11-28 17:25:47 · 1038 阅读 · 2 评论 -
使用pandas和xlwt,xlrd结合操作excel实现自动化
今天花了一小时给别人写的一个小程序结果真的让人激动哇import xlwtimport pandas as pdfrom xlutils.copy import copyimport xlrd# 创建一个汇总表并写入索引def new_workbook(): f = xlwt.Workbook() # 创建工作簿 # 新建一张表 sheet = f.add_...原创 2019-11-27 20:43:03 · 1882 阅读 · 1 评论 -
xlwt在爬虫中的实战(爬取豆瓣图书)
爬虫相关知识请阅读我的其他文章import reimport xlwtimport requestsfrom bs4 import BeautifulSoupdef getHtml(url): # 构造请求头 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:5...原创 2019-11-23 14:20:26 · 353 阅读 · 0 评论 -
数据分析之matplotlib扩展篇——pyecharts绘图
pyecharts介绍一. 简介pyecharts 是一个用于生成 Echarts 图表的类库。Echarts是百度开源的一个数据可视化 JS 库。 用 Echarts 生成的图可视化效果非常棒,pyecharts 是为了与 Python 进行对接,方便在 Python 中直接使用数据生成图。官网:http://pyecharts.org/#/zh-cn/quickstartGithub...原创 2019-11-23 14:13:38 · 1311 阅读 · 0 评论 -
数据分析之使用python来实现报表自动化(xlwt,xlrd)
python来实现报表自动化xlwt 常用功能xlrd 常用功能xlutils 常用功能xlwt写Excel时公式的应用xlwt写入特定目录(路径设置)python写excel — xlwt常用功能xlwt Python语言中,写入Excel文件的扩展工具。可以实现指定表单、指定单元格的写入。支持excel03版到excel2013版。xlwt对Excel只能进行只写操作...原创 2019-11-21 21:09:51 · 828 阅读 · 0 评论 -
数据分析实战(1)
今天帮别人写的一个文本数据分析程序import jiebaimport jieba.possegimport jieba.analyseimport reimport nltkfrom nltk.text import ContextIndexfrom nltk.classify import NaiveBayesClassifierfrom nltk.corpus import ...原创 2019-11-19 19:25:29 · 354 阅读 · 0 评论 -
数据分析之basemap模块
Basemap模块basemap是干什么的Basemap是Matplotlib的一个子包,负责地图绘制。在数据可视化过程中,我们常需要将数据在地图上画出来。比如说我们在地图上画出城市人口,飞机航线,军事基地,矿藏分布等等。这样的地理绘图有助于读者理解空间相关的信息。安装不能直接使用pip安装下载basemap和pyproj(与自己的python版本和电脑版本对应)地址:htt...原创 2019-11-16 21:33:11 · 8332 阅读 · 0 评论 -
数据分析之matplotlib详解
matplotlib介绍Matplotlib 是 Python 的绘图库。 它可与 NumPy 一起使用,提供了一种有效的 MatLab 开源替代方案。 它也可以和图形工具包一起使用,如 PyQt 和 wxPythonmatplotlib安装pip3 install matplotlib绘制常用图表一.折线图表示随着时间的推移某指标的变化趋势参数详解plt.plot(...原创 2019-10-11 21:40:43 · 868 阅读 · 0 评论 -
数据分析之pandas学习
pandas的安装pip3 install pandaspandas简介Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具pandas提供了大量能使我们快速便捷地处理数据的函数和方法它是使Python成为强...原创 2019-10-10 19:30:34 · 201 阅读 · 0 评论 -
数据分析之numpy学习
numpy的安装pip3 install numpynumpy的ndarray对象NumPy 最重要的一个特点是其 N 维数组对象 ndarray,它是一系列同类型数据的集合,以 0 下标为开始进行集合中元素的索引。ndarray 对象是用于存放同类型元素的多维数组。ndarray 中的每个元素在内存中都有相同存储大小的区域。numpy.array(object, dtype...原创 2019-10-09 21:56:52 · 265 阅读 · 0 评论