- 博客(77)
- 资源 (4)
- 收藏
- 关注
原创 5. Python3的基本类型(元组)
Python3的基本类型(元组)1 Python 的元组与列表相似,不同之处:元组不能修改,元组使用小括号(),列表使用方括号[]。2 元组的创建:只需要在括号中添加元素,并使用逗号隔开即可。In [1]: #测试代码:In [2]: tuple1 = ('baidu', 'baidu.com','baiduAI')In [3]: tuple2 = (1, 2, 3, 4)In [4]...
2019-07-30 11:36:30
198
原创 4. Python3的基本类型(列表)
Python3的简单基本类型之列表List1.简述列表[list],元组[tuple],字典[dict]2. 了解一下序列3. List(列表)1.简述列表[list],元组[tuple],字典[dict]1-1 python内置三种常用的数据结构:list,tuple,dict,都可用于保存多个数据项。1-2 列表和元组比较相似,都按照顺序保存元素,每个元素都有自己的索引,可以通过索引来访...
2019-07-29 17:05:58
222
原创 3. Python3的简单基本类型之字符串str(二)
Python3的简单基本类型字符串str(二)4.2 字符串入门String4.2.1 repr和字符串4.2.2 input和raw_input4.2.3 长字符串4.2.4 bytes4.2.5 字符串格式化4.2.6 Python自带两个帮助函数4.2.7 删除多余空白4.2.8 字符串的查找,替换4.2.9 字符串的分割,连接方法4.2.9 运算符4.2 字符串入门String字符串的...
2019-07-25 16:17:16
774
原创 1. 介绍一下python的优秀
Python是一种计算机程序设计语言。是一种面向对象的动态类型语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越来越多被用于独立的、大型项目的开发。是一种解释型脚本语言。Python基本信息 中文名称:蟒蛇 外文名称:Python 经典教材:Head First Python (大千世界,书籍太多,给我100年我也无法读完) 发行时间...
2019-07-24 14:28:46
258
原创 numpy的loadtxt导入文件时,怎样调过第一行标题
在用numpy的loadtxt导入数据文件时候,发现有报错:经过如下:第一次:#数据准备raw_data = np.loadtxt('D:/jupter_workspace/chapter4/cluster.txt') #导入数据文件X = raw_data[:, :-1] # 分割要聚类的数据y_true = raw_data[:, -1]print(X)------------...
2019-07-24 10:58:20
7137
1
翻译 小白学(Python数据分析与数据运营)的日常杂记16(聚类分析)
聚类分析1. 当心数据异常对聚类结果的影响1.1 数据的异常值1.2 数据的异常量纲2. 超大数据量时应该放弃K均值算法3. 聚类不仅是建模的终点,更是重要的中间预处理过程3.1 图像压缩3.2 图像分割3.3 图像理解3.4 异常检测3.5 数据离散化4. 高维数据上无法应用聚类吗?5. 如何选择聚类分析算法6. 代码实操:Python聚类分析聚类是数据挖掘和计算的基本任务,是将大量数据集中具...
2019-07-23 20:51:40
868
原创 实现抓取2019年中国最好学校排名等相关信息
为什么创建这个爬虫的小例子,是因为在某个地方看到了该网站http://www.zuihaodaxue.com/zuihaodaxuepaiming2019.html 的高校排名,所以想自己去直接crawl它一下,仅供自己学习使用。代码很简单,也很粗糙(未优化)#使用requests 库和 BeautifulSoup库中的bs4工具import requestsfrom bs4 import...
2019-07-23 11:44:48
216
翻译 小白学(Python数据分析与数据运营)的日常杂记14
离散化,对运营数据做逻辑分层离散化,把无限空间中有限的个体映射到有限的空间中去,以此提高算法的时空效率。通俗的说,离散化是在不改变数据相对大小的条件下,对数据进行相应的缩小。例如:原数据:1,999,100000,15;处理后:1,3,4,2;原数据:{100,200},{20,50000},{1,400};处理后:{3,4},{2,6},{1,5};
2019-07-19 17:14:55
152
原创 利用matplotlib绘制条形图,直观呈现2019年电影票房数据
效果图:'''以2019年内地电影票房总排行榜电影名和总票房为例,做一个横版直方图'''import matplotlib.pyplot as plt#from matplotlib.font_manager import FontProperties#font = FontProperties(fname=r"c:\windows\fonts\simsun.ttc", size=...
2019-07-19 11:47:06
2946
翻译 matplotlib设置显示中文方法
matplotlib显示中文(惠存)在jupyter中设置可能与本文主题无关,不过我还是想指出来:使用matplotlib库时,下面两种导入方式是等价的(我指的是等效,当然这个说法可以商榷:)import matplotlib.pyplot as pltimport pylab as plt【方式一】FontPropertiesimport matplotlib.pyplot a...
2019-07-19 09:21:45
1010
1
原创 matplotlib绘制散点图代码示例(知识点plt.scatter)
代码如下:# -*-coding:utf-8-*-#@Author: Songzq#@Time: 2019年07月18日06时#说明:#总结:import matplotlib.pyplot as plt #导入matplotlib.pyplot库#2019年4月份最高每日最高温度y_april_high = [16,19,21,28,21,20,19,17,9,18,19,2...
2019-07-18 07:28:46
1117
翻译 杂记:Linux1
Linux 系统启动过程1.linux启动时我们会看到许多启动信息。Linux系统的启动过程并不是大家想象中的那么复杂,其过程可以分为5个阶段:1). 内核的引导。2). 运行 init。3). 系统初始化。4). 建立终端 。5). 用户登录系统。2.内核引导当计算机打开电源后,首先是BIOS开机自检,按照BIOS中设置的启动设备(通常是硬盘)来启动。操作系统接管硬件以...
2019-07-16 14:27:45
147
原创 用matplotlib做一个随机1个小时的气温变化图
闲话少说,直接上代码,看注释就能明白!import matplotlib.pyplot as plt #导入matplotlib.pyplot库import random #导入random库x = range(0, 60) #设置取值范围为0~120,取得值用作分钟数,既 0到60分钟temperature = [random.randint(20,35) for i in rang...
2019-07-16 08:43:36
552
原创 Shell脚本学习指南1
1.假设你想知道现在系统上有多少人登录,可以使用who[song@localhost ~]$ whosong pts/0 2019-07-15 08:25 (192.168.178.1)root tty1 2019-07-15 08:26 (:0)2.在大型的、多用户的系统上,所列出来的列表可能很长,还没等我们计算出有多少登录用户,屏幕就已经...
2019-07-15 16:35:00
134
翻译 小白学(Python数据分析与数据运营)的日常杂记7
代码实操:Python数据清洗1 缺失值处理2 异常值处理3 重复值处理1 缺失值处理1-1. 对于缺失值的处理,主要配合使用sklearn.preprocessing中的Imputer类、Pandas和Numpy。其中由于Pandas对于数据探索、分析和探查的支持较为良好,因此围绕Pandas的缺失值处理较为常用。import pandas as pd #导入Pandas库import ...
2019-07-15 11:29:57
185
翻译 小白学(Python数据分析与数据运营)的日常杂记6
1. 读取图像数据1.1 Python读取图像通常使用PIL和OpenCV两个库1.1.1使用PIL读取图像Python Imaging Library中包含很多库,常用的是其中的Image,通过使用其中的open方法来读取图像,用法如下:代码如下from PIL import Image #导入库 file = 'cat.jpg' #定义图片地址 image = Ima...
2019-07-12 16:49:08
293
翻译 小白学(Python数据分析与数据运营)的日常杂记5
2.使用load方法读取数据文件import numpy as np # 导入nump库 write_data = np.array([[1, 2, 3, 4],[5, 6, 7, 8],[9, 10, 11, 12]])# 定义要存储的数据 np.save('load_data', write_data) # 保存为npy数据文件 read_data = np.load('load_d...
2019-07-12 13:48:01
293
原创 小白学(Python数据分析与数据运营)的日常杂记4
数据化运营的数据来源1. 从数据结构类型上来讲,包括结构化和非结构化数据;从数据来源方式来分,既有导出的数据文件、数据库等常见来源,又有流式、API等复杂系统接口和外部资源数据。2.数据化运营的数据来源类型:数据文件、数据库、API、流式数据、外部公开数据和其他来源等。数据文件:存储数据的文件,广义上,任何文件中存储的信息都可以称为数据;狭义上,数据文件中以数字或文本形式存储的结构化的...
2019-07-12 11:55:33
306
翻译 小白学(Python数据分析与数据运营)的日常杂记3
案例数据可以访问录下链接下载:链接:https://pan.baidu.com/s/1fvdFMz9WwTXOKn_fL4AXyA提取码:huhu复制这段内容后打开百度网盘手机App,操作更方便哦第一个用Python实现的数据化运营分析实例——销售预测1 案例场景:每个销售型公司都有一定的促销费用,促销费用可以带来销售量的显著提升;当给出一定的促销费用时,预计会带来多大的商品销...
2019-07-11 17:46:21
805
翻译 小白学(Python数据分析与数据运营)的日常杂记2
数据化运营所需的Python相关工具和组件1.Python程序Python仍然是两个系列的版本并存Python 2和Python 3这两个版本的语法不完全兼容2.Python IDE工具——PyCharm。3.Python第三方库——交互开发库、科学计算库、机器学习库、自然语言库、数据库连接库、图像处理库、网络爬虫库、图像展示库等交互开发库——IPython 科学计算库——...
2019-07-11 14:56:38
277
翻译 小白学(Python数据分析与数据运营)的日常杂记1
Python数据分析与数据运营 (宋天龙 著)(仅供学习,提取码:cm5q)1.Python是一种面向对象的解释型计算机程序设计语言,作者:荷兰人荷兰人:吉多·范罗苏姆(Guido van Rossum),发明时间:1989年 (那一年,我1岁都还不到啊啊啊啊!)2.为什么要选择Python而非其他语言(例如R)进行数据处理、分析和挖掘?(下面是对python表忠心的时候了)...
2019-07-11 11:39:32
819
转载 redhat6.5更换为contos 的yum源
原文引自:https://www.iyunv.com/thread-41279-1-1.htmlredhat默认自带的yum源需要注册,才能更新,报错:This system is not registered to Red Hat Subscription Management. You can use subscription-manager to register.可替换为centos...
2019-07-03 15:45:15
113
原创 python第三方库xlrd处理读取excel文件
准备环境:1. python3.7.3 2.安装xlrd windows下一般使用pip install xlrd, 安装的xlrd版本:1.2.03.excel中的数据自己可以填写几行。代码:import xlrdfilename = 'ch10-data.xls'open_workbook = xlrd.open_workbook(filename=filename)...
2019-06-14 16:58:16
721
原创 python读取csv格式的文件简单代码
环境:python 3.7.3ch02-data.csv文件:文件内容如下:自己建立一个csv文件,copy进去即可:"Year","Country","Sex","Display Value","Numeric""2000","USA","Both sexes","77","77.00000""2008","Canada","Both sexes","80","89.00000"...
2019-06-14 16:17:32
1435
原创 Python数据处理(1)
1.python中,有几个内置的工具:type, dir, help: type:可以帮助确定我们的对象属于哪种数据类型,在python中,将变量放到type()的括号中, dir:会返回一个内置方法与属性的列表,帮我们列出特定数据类型能做的所有事情,举例用字符串‘cat,dog,horse’>>> dir('cat,dog,horse')['__add...
2019-06-12 19:24:22
251
翻译 社交网站的数据挖掘与分析(1)
“种一棵树最好的时间是十年前,其次是现在。”第1章绪论:Twitter数据的处理1.Windows安装环境:Python,2.安装相关库: C:\Users\admin>pip install numpy 提示:Successfully installed numpy-1.16.4, 证明安装成功(后续将省略) C:\Users\ad...
2019-06-12 11:03:52
606
原创 jupyter notebook连接Mongodb的简单操作
1.在cmd命令行中,启动jupyter ,键入命令:jupyter notebook2.启动终端:3.启动终端后,进入到mongodb的bin目录下(windows环境下)并执行命令进入mongodb命令,我的如下,:4.查看mongodb中的数据库有哪些?键入命令:show dbs5.使用自己需要选择数据库,键入:use ceshi,并且展示数据库中表(集合)...
2019-06-11 08:52:18
2187
2
原创 python3.7.3中安装jupyter和charts,启动时报错import 的包不存在问题
2019.6.11日更新,适用python 3.7.3版本1.windows下,启动jupyter命令:在cmd命令行下,输入:jupyter notebook,启动成功会弹出浏览器页面:2.由于我的已经替换完了charts中的7个文件,故运行import charts不会报错,启动正常的截图如下:3.下面说一下import charts失败时候的解决办法,当启动失败时候,多数是由于...
2019-06-11 07:54:08
820
2
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅