python不等长数组_python – 具有不同长度数组的Pandas

最新推荐文章于 2023-01-04 15:11:55 发布

weixin_39965673

最新推荐文章于 2023-01-04 15:11:55 发布

阅读量963

点赞数

文章标签： python不等长数组

本文链接：https://blog.csdn.net/weixin_39965673/article/details/111532588

版权

这是我的代码.由于要解析的原始数据的内容,我最终得到的“用户列表”和“推文列表”的长度不同.将列表作为列写入数据框时,我得到ValueError：数组必须全长相同.我意识到这一点,但一直在寻找一种解决方法,在较短阵列的正确位置打印0或NaN.有任何想法吗？

import pandas

from bs4 import BeautifulSoup

soup = BeautifulSoup(open('#raw.html'))

chunk = soup.find_all('div', class_='content')

userlist = []

tweetlist = []

for tweet in chunk:

username = tweet.find_all(class_='username js-action-profile-name')

for user in username:

user2 = user.get_text()

userlist.append(user2)

for text in chunk:

tweets = text.find_all(class_='js-tweet-text tweet-text')

for tweet in tweets:

tweet2 = tweet.get_text().encode('utf-8')

tweetlist.append('|'+tweet2)

print len(tweetlist)

print len(userlist)

#MAKE A DATAFRAME WITH THIS

data = {'tweet' : tweetlist, 'user' : userlist}

frame = pandas.DataFrame(data)

print frame

# Export dataframe to csv

frame.to_csv('#parsed.csv', index=False)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39965673

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

关于python3的不同长度数组的输出

yt_zhang的博客

05-22

963

使用python 3.7，openpyxl模块处理list时出现数据丢失本人使用python3.7，在使用模块 openpyxl 过程中，发现不同长度的list，写入到Excel中时，数据会丢失。如下： #usr/bin/ env python from openpyxl import Workbook wb = Workbook() ws = wb.create_sheet("sheet1") ws = wb.active array = [ ['p', 'y', 't', 'h', '

pandas将长度不同的list或Series合并成一个dataframe

longwei92的博客

03-05

8571

不同长度的Series和DataFrame合并 # s1为一个DataFrame，s2为一个Series def expand_columns(s1, s2): s1.np.array(s1).tolist() data = [(k, ','.join(v)) for k in s2 for v in s1] data = pd.DataFrame(data, columns=[s2.nam...

参与评论您还未登录，请先登录后发表或查看评论

关于python3的不同长度数组的输出_2

yt_zhang的博客

05-24

623

** 使用python 3.7，openpyxl模块处理list时出现数据丢失 ** 之前发过一篇文章，现在这一篇是接着上一篇使用openpyxl模块时，数据丢失问题已经解决了，之前数据丢失是因为使用的方法错了，以下为正确的使用方法，正确代码如下： #usr/bin/ env python from openpyxl import Workbook #创建工作簿 wb = Workbook() ws = wb.create_sheet("sheet") #ws = worksheet,创建

pandas数据读取

DDXHEAVEN的博客

07-21

195

code import pandas food_info = pandas.read_csv("./Desktop/table.csv") print(type(food_info)) 注释 import pansas ：导入pandas库，类似于c语言的#include pandas.read_csv（）：读取csv文件，参数可谓绝对路径，也可为相对路径。这里使用的是Anaconda的 Ju...

python不等长列表转化成DataFrame

知识碎片

12-03

4359

不同长度列表横向合并成DataFrame import pandas as pd a = [1,2,3] b = [4,5] c = ['a','b','c','d'] df = pd.concat([pd.DataFrame(a),pd.DataFrame(b)],axis=1) # 若axis=1，则纵向合并 print(df) 0 0 0 0 1.0 4.0 a 1 2.0 5.0 b 2 3.0 NaN c 3 NaN NaN d 字典中多个不同长度列表横行合并成DataFrame .

pandas数据长度不同时，不能保存excel，处理办法

龙先森的博客

10-25

2715

问题原因：若将所有数据要保存到一个sheet中，要保证没一列的数据长度要相同，但是有时会有，数据集中，有列数不同情况，这样是不能输出excel，但是又不能单独保存多个excel文件，这时可将（长度不同的列）保存在多个sheet中。 import pandas list1 = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] # print(len(list1)) # 长度为10 ...

python可视化工具pandas_bokeh作图技巧详解

python技巧分享

05-29

1568

史莱克七怪都要去海神岛练级了, 你的职场技能是否储备的够多了呢? 前言: python中有很多可视化的工具包,比如入门级的matplotlib, 进阶级seaborn, 还有可以做出交互图的bokeh、pyechart、plotly、ggplot、pandas-bokeh, 工作中该选择哪个作为自己的主要魂技呢? 学技能是为了解决工作中问题: 功能相同的工具包了解一个就够在你对上述工具包有一定了解的情况下, 日常一些重复项工作需要作图建议考虑两个方向: - pandas-bokeh: - 优点: 快

python numpy pandas 题目_python综合学习四之Numpy和Pandas(下)

weixin_42452642的博客

02-19

447

这一节继续学习Numpy和Pandas。一、numpy基础运算二通过上一节的学习，我们可以了解到一部分矩阵中元素的计算和查找操作。然而在日常使用中，对应元素的索引也是非常重要的。依然，让我们先从一个脚本开始：# -*- coding:utf-8 -*-"""@author: Corwien@file: np_yunsuan.py@time: 18/8/26 23:37"""import nump...

[python] 如何将不等长的list写入csv

cyx441984694的博客

07-06

6734

这是一个总结。其中包括如何将不同长度的list写入csv中，还有如何将排列组合获得的列表写入csv中。如果有看不懂的地方，欢迎留言。如果要转发的话，请注明出处。 1. 将不同长度的list写入csv中这里面有两种挺有意思的方法。 import csv ##https://stackoverflow.com/questions/42086462/how-to-write-two-lis...

python输入定长数组和输入不定长数组

Cai_Xu_Kun的博客

12-01

6139

输入定长数组 a,b,c = map(int,input().split( )) list = [a,b,c] print(list) 输入一维不定长数组 # arr = input('') #输入一个一维数组，每个数之间使空格隔开 # num = [int(n) for n in arr.split(' ')] #将输入每个数以空格键隔开做成数组 # print(num) #打印数组 ...

不同长度的列表构建DataFrame

菜的抠脚的博客

01-22

9664

a = [1, 2, 3] b = [1, 2] c = [1, 2, 3, 4] df = pd.concat([pd.DataFrame({'a': a}), pd.DataFrame({'b':b}), pd.DataFrame({'c':c})], axis=1) df.fillna(0)

numpy按列连接两个维数不同的数组

庸木自琢

03-19

6572

合并两个维数不同的ndarray 假设我们有一个3×2 numpy数组： x = array(([[1,2], [3, 4], [5,6]])) 现在需要把它与一个一维数组： y = array(([7, 8,9])) 通过将其添加到行的末尾，连接为一个3×3 numpy数组，如下所示： array([[1,2,7], [3,4,8], [5,6,9]]) 在nu...

python不等长数组_长度不等的数组中的Numpy数组

weixin_39700625的博客

12-19

3057

创建对象数组最可靠的方法是初始化并填充它。np.array的行为太可变。在In [658]: alist = [np.ones((5,10),int), np.zeros((3,10),int), np.arange(60).resh...: ape(6,10)]In [659]: arr = np.empty(len(alist), dtype=object)In [660]: arr[:] =...

python不等长数组_连接不同长度的numpy数组的字典（如果可能，避免手动循环）...

weixin_39999730的博客

12-19

692

I am looking for a way to concatenate the values in two python dictionaries that contain numpy arrays of arbitrary size whilst avoiding having to manually loop over the dictionary keys. For example:im...

DAY 05