数据分析
文章平均质量分 75
PhoenixShine
这个作者很懒,什么都没留下…
展开
-
pandas中的数据结构Series简单介绍
pandas中主要有两种数据结构:Series 和 DataFrame。Series 是带有轴标签(索引)的一维数组。DataFrame 是二维表格数据,有行索引也有列索引,可以看作是扩展的 Series。文章目录Series 和 DataFrame 的区别Series 数据构建Series 数据读取Series 排序、缺失值Series 和 DataFrame 的区别我们可以通过下面的例子来看看,Series 和 DataFrame 的区别。import pandas as pddict1原创 2020-08-27 21:42:06 · 1148 阅读 · 0 评论 -
Numpy矩阵(二维)拼接与分割方法
文章目录矩阵拼接水平拼接(沿着axis=1的方向)垂直拼接(沿着axis=0的方向)矩阵分割水平分割(沿着axis=1的方向)垂直分割(沿着axis=0的方向)矩阵拼接先建立 2 个numpy矩阵:import numpy as np# 新建2个numpy矩阵a1 = np.array([[1, 2, 3], [4, 5, 6]])a2 = np.array([[7, 8, 9], [10, 11, 12]])print("a1:\n", a1)print("a2:\n", a2)上面原创 2020-08-15 20:20:04 · 9849 阅读 · 0 评论 -
numpy矩阵中维度的理解
Numpy是python中的一个很重要的科学计算库,而在使用numpy时,经常需要axis来指定运算的轴,在计算时会沿着指定轴进行运算。比如:np.max(), np.min(), np.mean(), np.sum()等等。一维矩阵一维矩阵,只有一个维度,所以只能指定axis=0或者不指定,这比较好理解。如下面的代码所示:import numpy as npa = np.arange(6)print(a)print("max: ", np.max(a, axis=0)) # 指定axis=0原创 2020-08-10 17:33:23 · 5278 阅读 · 0 评论 -
python中矩阵转置4种方法
文章目录1. 使用双重循环2. 使用列表表达式3. 使用zip函数4. 使用numpy模块1. 使用双重循环# python 双重循环arr = [[ 1, 2, 3], [ 4, 5, 6], [ 7, 8, 9], [10, 11, 12]]arr2 = []# 数组的第二维维度for i in range(len(arr[0])): temp = [] # 数组的第一维维度 for j in range(le原创 2020-08-08 16:08:05 · 26462 阅读 · 0 评论 -
python中文件的读写【三】(csv文件)
文章目录csv文件介绍csv文件的读取csv文件的写入csv文件介绍csv文件是用逗号作为分隔符的文件。用Excel打开如下用记事本打开如下csv文件的读取这里要导入csv模块,import csv。我们的csv文件内容如下:name,gender,home,labelaaa,M,Shanghai,0bbb,W,Beijing,1ccc,W,Guangzhou,0ddd,M,Shenzhen,1# 普通的读取方法import csvfrom collections impo原创 2020-07-29 15:07:50 · 315 阅读 · 0 评论 -
Python中文件的读写【二】(json文件)
Python中读写json文件,需要导入json库:import json函数简介功能json.loadsjson字符串 -> python对象将json字符串解码为python对象(对象指的是字典、列表等)【操作字符串】json.dumpsjson字符串 <- python对象将python对象编码为json字符串【操作字符串】json.loadjson文件 -> python对象提取json文件对象中的内容,并将json字符串解码为pyt原创 2020-07-27 17:54:31 · 284 阅读 · 0 评论 -
Python中文件的读写【一】(txt文件或者普通文本文件)
python中常用打开模式的含义与区别打开模式含义r只读,文件不存在会报错。文件的指针将会放在文件的开头。这是默认模式。r+可读可写,文件不存在会报错。文件指针将会放在文件的开头。w只写,文件不存在,会创建新文件。从开头开始编辑,即原有内容会被删除。w+可写可读,文件不存在,会创建新文件。从开头开始编辑,即原有内容会被删除。由于原有内容被删除,所以读不了具体文件内容。a追加写入,文件不存在,会创建新文件。文件存在的话,文件指针将会放在文件的结尾。新的内原创 2020-07-20 23:35:00 · 593 阅读 · 0 评论 -
Logistic Regression(逻辑回归)中的损失函数理解
问题:线性回归中,当我们有m个样本的时候,我们用的是损失函数是J(θ)=1m∑i=1m12(hθ(x(i))−y(i))2 J_{(\theta)} = \frac{1}{m}\sum_{i=1}^m\frac{1}{2}(h_{\theta}(x^{(i)}) - y^{(i)})^2 J(θ)=m1i=1∑m21(hθ(x(i))−y(i))2但是,到了逻辑回归中,损失函数一下子...原创 2019-12-03 15:12:46 · 2581 阅读 · 0 评论 -
Win10系统下,Anaconda 环境变量设置的两种方法
Win10系统下,Anaconda 环境变量设置的两种方法为什么要设置环境变量?设置环境变量,就可以在CMD中方便的使用conda命令和python环境。如下图所示:1. 在安装的时候,就可以勾选“Add Anaconda to my PATH environment variable”。2. 如果没有勾选,也可以自己手动设置。找到环境变量:计算机 -> 属性 -> 高级...原创 2019-05-09 11:34:56 · 31987 阅读 · 10 评论 -
Python各个应用领域相关库介绍-Python计算生态概览
本文主要是介绍Python各个应用领域中的相关主流库,所列的库不全,只是为实际应用Python提供一个参考。下图是一个概览图。 Python计算生态概览1. 数据处理&人工智能领域1.1 Python数据分析相关的库Numpy:表达N维数组的最基础库Pandas:Python数据分析高层次应用库Scipy:数学、科学和工程计算功能库1.2 Python数据可视化相...原创 2018-07-21 17:59:35 · 1407 阅读 · 0 评论