![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python数据分析
文章平均质量分 61
borayolo
殊途同归
展开
-
python_pandas
首先推荐一个比较好的Python pandas DataFrame学习网址 网址: http://www.cnblogs.com/chaosimple/p/4153083.html 说明: 首先百度Python pandas DataFrame,下面列出DataFrame该数据结构的部分使用方法,并对其进行说明, DataFrame和Series作为padans两个主要的数据结构转载 2017-04-28 14:47:47 · 353 阅读 · 0 评论 -
python_20171120_read_csv读取数据编码问题
问题:自己建立了一个excel文件,另存为csv,读取是错误:utf-8.codec can't decode byte 0xb5 in position 2: invalid start by。 解决办法:用记事本另存,将编码改为utf-8。原创 2017-11-20 21:50:03 · 3020 阅读 · 0 评论 -
python数据持久存储:pickle模块的基本使用
python的pickle模块实现了基本的数据序列和反序列化。通过pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去,永久存储;通过pickle模块的反序列化操作,我们能够从文件中创建上一次程序保存的对象。 基本接口: pickle.dump(obj, file, [,protocol]) 注解:将对象obj保存到文件file中去。 protoc转载 2017-11-18 15:19:45 · 300 阅读 · 0 评论 -
python_ad_pca
#! /usr/bin/env python #coding=utf-8 import pandas as pd import numpy as np #定义一个函数:1.前几个特征是数值,pandas把他们看成是字符串2.处理缺失值 def convert_number(x): try: return float(x) except ValueError:原创 2017-05-01 13:30:55 · 845 阅读 · 1 评论 -
python_movie_apriori
#! /usr/bin/env python #coding=utf-8 import pandas as pd root="F:/Data/exe/ml-100k/" all_ratings=pd.read_csv(root+"u.data",delimiter="\t",header=None)#原始数据是制表符且没有表头 all_ratings.columns=(["UserId","Mov原创 2017-04-30 16:36:33 · 974 阅读 · 0 评论 -
python:_csv.Error: line contains NULL byte错误
#! /usr/bin/env python #coding=utf-8 import networkx as nx import unicodecsv as csv path="F:/Data/exe/marvel.csv" def graph_from_csv(path): graph=nx.Graph(name="Heroic Social Network") with op原创 2017-05-15 15:41:53 · 4034 阅读 · 1 评论 -
python_car_可视化
#! /usr/bin/env python #coding=utf-8 import pandas as pd import numpy as np #import ggplot import matplotlib.pyplot as plt path="F:/Data/exe/vehicles.csv" vehicles=pd.read_csv(path) #print(len(vehicle原创 2017-05-12 17:42:36 · 1128 阅读 · 0 评论 -
urllib.error.URLError: <urlopen error [WinError 10060] 由于连接方在一段时间后没有正确答复或连接的主机没有反应,连接尝试失败。>
不知道怎么办?原创 2017-05-01 20:30:20 · 16087 阅读 · 7 评论 -
python_pandas.read_csv
pandas.read_csv参数整理 读取CSV(逗号分割)文件到DataFrame 也支持文件的部分导入和选择迭代 更多帮助参见:http://pandas.pydata.org/pandas-docs/stable/io.html 参数: filepath_or_buffer : str,pathlib。str, pathlib.Path, py._p转载 2017-05-01 13:10:32 · 1157 阅读 · 0 评论 -
python_adult_pca
#! /usr/bin/env python #coding=utf-8 import pandas as pd root="F:/Data/exe/3_adult/"#我没等网页全部加载出来就全选复制了,导致数据集未完整!!!!!!!!!!!!! adult=pd.read_csv(root+"adult.data.txt",header=None) adult.columns=(["Age",原创 2017-05-01 11:34:24 · 1110 阅读 · 0 评论 -
python_nba_tree
#! /usr/bin/env python #coding=utf-8 import pandas as pd root="F:/Data/data/" nba=pd.read_csv(root+"nba.txt",parse_dates=["Date"]) nba.columns=["Date","Start","Visitor Team","Visitor Pts","Home Team",原创 2017-04-29 23:21:11 · 464 阅读 · 0 评论 -
anaconda 使用import sklearn.model_selection 出错ImportError: No module named model_selection
昨天在运行Python项目时,报ImportError: No module named 'sklearn.model_selection',当我使用pip install sklearn.model_selection时,仍然报错,报错信息如下: 问题原因 在anaconda中通过如下命令查看sklearn的版本: in: sklearn.version o转载 2017-04-28 17:01:37 · 1559 阅读 · 1 评论 -
python_20171123_二手车信息探索
## ************第一步:抓取该平台二手车的所有品牌 *************** import numpy as np import pandas as pd import matplotlib.pyplot as plt import os#貌似是自带的,不用下载包了 from sklearn.linear_model import LinearRegression plt.rc原创 2017-12-20 17:26:25 · 515 阅读 · 0 评论