python
文章平均质量分 64
Edwina414
这个作者很懒,什么都没留下…
展开
-
《利用python进行数据分析》读书笔记之案例二:全美婴儿姓名
这份数据包含了从1880到2010年间的婴儿名字频率数据,其数据形式是多个txt文件,且用逗号分隔,可以用pandas.read_csv将其加载到DataFrame中,并且用pandas.concat将所有数据都组装到一个DataFrame。 years=range(1880,2011) pieces=[] columns=['name','sex','births']原创 2017-04-06 17:03:39 · 2537 阅读 · 0 评论 -
《利用python进行数据分析》读书笔记之案例一:来自bit.ly的1.usa.gov数据
从网上下来的数据文件,先读取文件中的第一行查看是什么数据类型 path="usagov_data.txt" open(path).readline() 结果为: 从上面可以看出它是json格式,在python中有许多内置或第三方模块可以将json字符串转换成python字典对象。将使用json模块及l原创 2017-03-29 20:51:07 · 1434 阅读 · 2 评论 -
《利用python进行数据分析》读书笔记之案例二:MovieLnes 1M数据集
MovieLens 1M数据集含有来自6000名用户对4000部电影的100万条评分数据。它分为三个表:评分,用户信息和 电影信息。将该数据解压出来以后,可以通过pandas.read_table将各个表分别读到一个pandas DataFrame对象中 import pandas as pd import numpy as np import matp原创 2017-03-30 18:33:59 · 1079 阅读 · 1 评论 -
爬取得到数据写入过文件时出现UnicodeEncodeError的错误
最近刚接触lda主题模型,为了加深自己的理解,从网上爬取文本进行主题模型的构建和文本的主题预测。 在获得文本,写入文件时,出现了以下问题:UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-10: ordinal not in range(128)。 这篇博文(原创 2017-07-08 22:19:17 · 563 阅读 · 0 评论