python数据分析与机器学习实战
不变不中
多想、多做、多总结,别怕吃亏。
展开
-
006.python科学计算库matplotlib(上)
测试数据 unrate.csv原创 2018-09-16 15:09:06 · 224 阅读 · 0 评论 -
010.python科学计算库seaborn(下)
categoryimport matplotlib.pyplot as pltimport seaborn as snstips = sns.load_dataset("tips")tips.head()print(tips)# stripplot:画一个散点图,其中一个变量是类别的sns.stripplot(x="day", y="total_bill", data=原创 2018-09-27 10:35:20 · 496 阅读 · 0 评论 -
009.python科学计算库seaborn(中)
a原创 2018-09-26 17:54:33 · 293 阅读 · 0 评论 -
008.python科学计算库seaborn(上)
测试数据 iris.dataStyleimport seaborn as snsimport numpy as npimport matplotlib as mplimport matplotlib.pyplot as pltdef sinplot(flip=1): x = np.linspace(0, 14, 100) for i in range(1, 7...原创 2018-09-26 16:01:27 · 508 阅读 · 0 评论 -
005.python科学计算库pandas(下)
测试数据 fandango_score_comparison.csvseriesimport pandas as pdfrom pandas import Seriesfandango = pd.read_csv('fandango_score_comparison.csv')series_film = fandango['FILM']print(series_film[...原创 2018-09-15 15:46:35 · 508 阅读 · 0 评论 -
004.python科学计算库pandas(中)
测试数据 titanic_train.csvisnullimport pandastitanic_survival = pandas.read_csv("titanic_train.csv")# Pandas库使用NaN(非数字)表示缺失值# 我们可以使用pandas.isnull()函数,它获取一个pandas series并返回一系列的True和Falseage = ...原创 2018-09-14 17:34:04 · 275 阅读 · 0 评论 -
003.python科学计算库pandas(上)
测试数据 food_info.csvheadimport pandasfood_info = pandas.read_csv("food_info.csv")# csv文件类型 DataFrameprint(type(food_info))print("---1")# dtypes 返回每个列的数据类型。结果为字典# food_info.dtyp原创 2018-09-14 14:06:01 · 454 阅读 · 0 评论 -
002.python科学计算库numpy(下)
reshapeimport numpy as np# arange 在给定的间隔内返回等距值# reshape 返回一个包含具有新形状的相同数据的数组a = np.arange(15).reshape(3, 5)print(a)arangeimport numpy as np# arange 在给定的间隔内返回等距值print(np.arange(10,...原创 2018-09-13 19:31:46 · 253 阅读 · 0 评论 -
001.python科学计算库numpy(上)
genfromtxt从文本文件加载数据,并按指定的方式处理缺失值。import numpy# genfromtxt 从文本文件加载数据,并按指定的方式处理缺失值。# delimiter 用来分隔值的字符串。# 默认情况下,任何连续的空格都充当分隔符。# 一个整数或整数序列也可以作为每个字段的宽度提供# dtype 结果数组的可选数据类...原创 2018-09-13 16:09:38 · 233 阅读 · 0 评论 -
007.python科学计算库matplotlib(下)
测试数据 fandango_scores.csvbarimport matplotlib.pyplot as pltimport pandas as pdfrom numpy import arangereviews = pd.read_csv('fandango_scores.csv')cols = ['FILM', 'RT_user_norm', 'Metacriti...原创 2018-09-16 16:39:00 · 378 阅读 · 0 评论 -
011.线性回归算法推导
预备知识高斯分布一维正态分布似然函数最大似然估计PS:之前一直比较纠结,最大似然估计的定义为什么是概率密度函数(或概率质量函数)的累积,看了上面的似然函数中的计算实例才逐渐明白。似然函数取得最大值表示相应的参数能够使得统计模型最为合理。线性模型 线性回归是依据样本数据上抽取的特征,预测连续值结果。简单的例子如依据身高去预测体重,如实验室中根...原创 2018-09-27 18:45:00 · 397 阅读 · 0 评论