python数据分析
文章平均质量分 90
sodleave
私信一般不怎么看,请发邮件联系:luoyu06@mail.ustc.edu.cn
展开
-
Dataquest学习总结[3]
Step 2: Intermediate Python And PandasChallenge: Summarizing Data 数据集地址:Github repository对数据集进行处理:#1.读文件import pandas as pdall_ages=pd.read_csv("all-ages.csv")recent_grads=pd.read原创 2017-05-10 22:18:22 · 747 阅读 · 0 评论 -
Dataquest学习总结[10]
Step 6: Machine Learning Decision Trees>>Introduction to Decision Trees构建决策树时将类别型特征转换为数值型数据:用到pandas的categorical,使用Categorical.from_array方法numpy.bincount 计算array中各值出现的频次,类似于pandas的value_c原创 2017-06-10 17:15:28 · 701 阅读 · 0 评论 -
Dataquest学习总结[8]-Machine Learning
Step 6: Machine Learning Machine Learning In Python: Beginner数据集:their machine learning repository >>读取表格型数据文件 read_table methodmpg = pd.read_table("auto-mpg.data", delim_whitespace=True原创 2017-05-24 21:14:11 · 673 阅读 · 0 评论 -
Dataquest学习总结[7]
继续Step 5: Statistics And Linear Algebra/Probability And Statistics In Python: Intermediate Introduction to probabilityCalculating Probabilities>>数据集bike sharing Dataset,地址here 地板除//,5//4=原创 2017-05-22 21:57:13 · 507 阅读 · 0 评论 -
Dataquest学习总结[9]
Step 6: Machine Learning Machine Learning In Python: Intermediate>>Multiclass classification:pandas.get_dummies() 对dataframe或Series中value值进行变换,尤其是在value有多个取值时,转换为多个二进制的结果,需要进行dummy处理的依据:针对于原创 2017-06-01 20:41:56 · 1144 阅读 · 0 评论 -
Dataquest学习总结[6]
暂时跳过Step 3: The Command Line 和Step 4: Working With Data Sources 现在学习Step 5: Statistics And Linear Algebra 部分Probability And Statistics In Python: BeginnerIntroduction To Statistics>>Series和D原创 2017-05-20 17:30:08 · 1782 阅读 · 0 评论 -
Dataquest学习总结[2]
Step 2: Intermediate Python And PandasA.使用numpy读取csv文件import numpynfl = numpy.genfromtxt("nfl.csv", delimiter=",")会返回一个numpy array的结果,即numpy.ndarray class,但是读取进来的好像只有数字有效。原创 2017-05-10 11:36:51 · 870 阅读 · 0 评论 -
Dataquest学习总结[1]
关于step1 introduction to python 中Error Handling部分:可以用于对异常数据,缺失数据进行处理原创 2017-05-08 22:36:07 · 2937 阅读 · 1 评论 -
Dataquest学习总结[5]
Step 2: Intermediate Python And Pandas/Data Cleaning>>表格的合并,pandas.concat() z = pd.concat([x,y], axis=0) #合并x和y,y在x下面(对每一列操作得到行)>>pd.read_csv() 也可以读取txt文件,根据传入的参数,对编码格式和分隔符进行设置all_survey=p原创 2017-05-17 09:54:23 · 920 阅读 · 1 评论 -
python基本语法和注意事项
1.几个常用的网站Python IDE下载:(1)Python(x,y)的官方下载地址(2)Python(x,y)的其他下载地址(3)Anaconda下载地址(推荐下载此IDE,网站稳定,使用方式与Python(x,y)基本一样)2.Python参考教程和网站(1)Magnus Lie Hetland,Beginning Python: from Novice to...原创 2017-05-05 11:30:54 · 1161 阅读 · 0 评论 -
Dataquest学习总结[4]
继续Intermediate Python and Pandas / Data Analysis with Pandas: Intermediate /Guided Project: Analyzing Thanksgiving Dinner: 数据集地址:here用到的方法: pandas.Series.value_counts() import pandas as p原创 2017-05-11 20:47:02 · 1032 阅读 · 0 评论 -
关于python中值传递和引用传递的问题
主要参见于下面两个博客:http://blog.csdn.net/dream_angel_z/article/details/51496044http://www.cnblogs.com/buptldf/articles/4976561.html自己这里再做下总结:python的传递方式可以认为“传对象引用”,是传值和传引用的一种综合。针对于不可变对象(变量,tuple原创 2017-08-06 17:42:42 · 655 阅读 · 0 评论