![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python数据分析
风浅安然
这个作者很懒,什么都没留下…
展开
-
数据分析
数据分析最近在学数据分析,这期间,看了不少书,也敲了很多代码,对数据分析有了比较深入的了解。想写点东西,和大家一起分享。编程语言 1.Python 2.R 3.Matlab 数据分析首推R和Python,这点大家已经达成了共识。为什么要把Matlab放这里面的?因为,Matlab是我数学系的一大神器,积分,微分,解微分方程,画图都很方便。Matlab还是很强大的,我觉得,如果它不是商业软件原创 2017-07-21 16:14:59 · 4727 阅读 · 1 评论 -
python读取mat文件
mat为Matlab保存数据的格式,使用python的scipy包也可以进行读取import scipy.io as siodef load_data(path): data_ = sio.loadmat(path) data = data_['data'] labels = data_['labels'].flatten() return data, la...原创 2018-02-20 20:27:11 · 1927 阅读 · 0 评论 -
plt绘图与Axes绘图
使用matplotlib.pyplot(plt)进行绘图时,有两种方法:直接使用plt里的函数使用面向对象的方法,先产生一个Axes对象,再对此对象进行操作,实现绘图第二种方法可以实现更多操作,具有更好的定制性使用plt绘图import numpy as npimport matplotlib.pyplot as pltplt.rcParams['font.sans...原创 2018-02-20 15:39:18 · 10621 阅读 · 1 评论 -
Matplotlib及Seaborn中文显示问题
在使用matplotlib及seaborn时,中文无法正常显示,显示结果为一个方框,解决方法:Matplotlibimport numpy as npimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = ['SimHei'] # 解决中文显示问题-设置字体为黑体plt.rcParams['axes.u...原创 2018-02-20 15:27:52 · 20490 阅读 · 3 评论 -
Python函数之map、reduce、filter
map map(func, *iterables) –> map objectseq1 = [1, 2, 3, 4]seq2 = [5, 6, 7, 8]m1 = map(lambda x: x ** 2, seq1)print(list(m1))# [1, 4, 9, 16]m2 = map(lambda x, y: x + y, seq1, seq2)pri...原创 2018-02-21 13:57:18 · 168 阅读 · 0 评论 -
numpy之matrix和array的乘法区别
matrix和array的乘法有所区别1、arrayA * A是对应元素相乘,np.dot(A, A)是矩阵乘法2、matrixA * A是矩阵乘法,np.multiply(A, A)是对应元素相乘具体参考这篇博文[numpy]matrix和array的乘和加...原创 2018-02-21 15:00:33 · 713 阅读 · 0 评论 -
Python字典常见函数
items()keys()values()get()pop()popitem()update()setdefault() D.items() -> a set-like object providing a view on D’s items D.get(k[,d]) -> D[k] if k in D, else d. d defaults ...原创 2018-02-21 13:27:16 · 264 阅读 · 0 评论 -
numpy之array展开
flatten()可以将二维的array展成一维的 a.flatten(order=’C’) Return a copy of the array collapsed into one dimension. order= 'C' means to flatten in row-major (C-style) order. order='F' means to flat...原创 2018-02-21 18:44:01 · 12702 阅读 · 0 评论 -
Python之装饰器
装饰器就是一个以函数作为参数并返回一个替换函数的可执行函数 即装饰器是一个函数,其参数为函数,返回值也为函数 可理解为对函数的功能进行拓展,所以叫装饰# outer为装饰器,效果为给被装饰函数返回值结果加负号def outer(fun): def inner(x): return -fun(x) return innerde...原创 2018-02-21 20:02:13 · 137 阅读 · 0 评论 -
Python函数之*args与**kwargs
函数定义中参数前的*表示的是将调用时的多个参数放入元组中,**则表示将调用函数时的关键字参数放入一个字典中def one(*args): print(args) print((type(args)))one(1, 2, 3, 'a')# (1, 2, 3, 'a')# <class 'tuple'>def two(**kwargs): print...原创 2018-02-21 19:45:51 · 150 阅读 · 0 评论 -
读取sklearn中的数据集
在学习机器学习的时候,我们经常需要数据集来对算法的效果进行验证,sklearn库提供了部分数据集,我们可以很方便地使用from sklearn.datasets import load_digitsdigits = load_digits()dir(digits)# ['DESCR', 'data', 'images', 'target', 'target_names']data =...原创 2018-02-20 21:06:52 · 2586 阅读 · 0 评论 -
将数据集分为训练集和测试集
在获得数据集后,我们需要将数据集分为训练集和测试集,分别进行模型的训练和对模型进行评估,sklearn提供了train_test_split来分割训练集和测试集from sklearn.model_selection import train_test_splitX_train, X_test, y_train, y_test = train_test_split(X, y, test_s...原创 2018-02-20 21:13:53 · 15282 阅读 · 2 评论 -
numpy数组排序
获取最大最小值索引argsort(), 返回一个array, 其第i个位置的值为: 原数组从小到大排序,排第i个位置的值的索引import numpy as npx = np.array([1, 7, 3, 5, 2])x.argmax()# 1x.argmin()# 0index = x.argsort() # array([0, 4, 2, 3, 1], dtyp...原创 2018-02-20 22:27:20 · 1838 阅读 · 0 评论 -
Python基础(一)
Python基础(一)前面已经说过,想要系统的学习Python,可以在廖雪峰Python教程进行学习,这里只介绍与数据分析有关的Python知识。数据类型Python是一种弱类型的编程语言,在声明变量的时候,并不需要指定变量类型,但这不代表Python没有数据类型。实际上,Python会根据变量的值,自动为变量选择合适的数据类型。 下面介绍集中常见的数据类型 数据类型 含义 int原创 2017-08-09 18:15:54 · 385 阅读 · 0 评论 -
python基础(二)
这里主要讲Python的语法,控制语句,函数,模块和包。语法基础控制语句判断语句ifif...elseif...elif...elsex = 1if x == 1: print('x=1')y = 2if y == 2: print('y==2')else: print('y!=2')z = 3if z == 3: print('z=3')elif原创 2017-08-10 11:48:07 · 172 阅读 · 0 评论 -
Python基础(三)
这里主要将python的面向对象编程技术。类和对象类是对客观世界食物的抽象,而对象是类实例化后的实体。比如,水果是一个类,将其实例化为苹果,则苹果就是一个对象。类的定义class Fruit(): def __init__(self, name, color): self.name = name self.color = color def gr原创 2017-08-11 11:03:10 · 257 阅读 · 0 评论 -
numpy基础(一)
这里主要介绍numpy包。ndarray(数组)N维数组对象ndarray,是numpy中最重要的一个对象。创建ndarray用array函数import numpy as nudata = np.array([[1, 2], [3, 4]])type(data)#<class 'numpy.ndarray'>data.dtype#dtype('int64')data.shape#(2,原创 2017-08-15 14:39:37 · 347 阅读 · 0 评论 -
python指定文件编码格式
res = ['a', 'b', 'c', 'd']with open('职位名称.csv', 'w+', encoding='utf-8') as f: for i in res: f.write(i + '\n')原创 2018-02-27 14:29:11 · 1812 阅读 · 0 评论 -
python提取文本关键字
import jieba.analysekwords = jieba.analyse.extract_tags(text, 200)原创 2018-02-27 16:38:47 · 6588 阅读 · 0 评论 -
python提取文本关键字
import jieba.analysekwords = jieba.analyse.extract_tags(text, 200)原创 2018-02-27 16:39:07 · 5991 阅读 · 0 评论 -
python统计文本词频
import jiebafrom collections import Counterdata_ = jieba.cut(text)data = dict(Counter(data_))data2 = sorted(data.items(), key=lambda x: x[1], reverse=True)data2[:10]原创 2018-02-27 16:40:51 · 5505 阅读 · 0 评论 -
Python字典排序
x = { 'a': 1, 'b': 2, 'c': 5, 'd': 3}sorted(d.items(), key=lambda x: x[1])# [('a', 1), ('b', 2), ('d', 3), ('c', 5)]原创 2018-02-21 13:07:18 · 189 阅读 · 0 评论 -
selenium
from selenium import webdriverbrowser = webdriver.Chrome()# browser = webdriver.Firefox()browser.get("http://www.baidu.com")print(browser.page_source)ChromeDriver下载地址:https://pan.baidu.com/s/19...原创 2018-03-26 18:44:55 · 172 阅读 · 0 评论