python汉字转化为二进制,在python中将字典转换为二进制

最新推荐文章于 2023-02-14 19:56:13 发布

weixin_39553705

最新推荐文章于 2023-02-14 19:56:13 发布

阅读量646

点赞数

文章标签： python汉字转化为二进制

I have a dictionary with keys as my customer ID and values as my movie id. Though the customer has watched the same movie many times, I want it to make as one.

Here I need to convert my dictionary to binary data.

In all the rows I need the customers ID's and columns as movie id's, where if the customer has watched the movie, it gives 1 else 0.

d = {'121212121' : 111, 222, 333, 333,444, 444, '212121212' : 222, 555, 555, 666, '212123322' : 555, 666, 666, 666, 777}

Desired output :

customer ID 111 222 333 444 555 666 777

121212121 1 1 1 1 0 0 0

212121212 0 1 0 0 1 1 0

121323231 0 0 0 0 1 1 1

I have tried using count vectorizer()

code :

cv = CountVectorizer()

movies = cv.fit_transform(cust['movies_list'])

cols = cv.vocabulary_

movies_ = pd.DataFrame(movies.toarray(), columns = cols, index =

cust['customer_id'])

movies_

output :

customer ID 111 222 333 444 555 666 777

212121212 1 1 2 2 0 0 0

121212121 0 1 0 0 2 1 0

121323231 0 0 0 0 1 3 1

The customer Id's dint match and I got a count on how many times he watched the movie.

解决方案

It looks like you can just use clip_upper to clip positive values to 1.

movies_.clip_upper(1)

111 222 333 444 555 666 777

121212121 1 1 1 1 0 0 0

212121212 0 1 0 0 1 1 0

212123322 0 0 0 0 1 1 1

Here's an alternative solution starting with d. You can use pd.get_dummies, followed by clip_upper.

import pandas as pd

df = pd.concat([

pd.Series(v, name=k).astype(str) for k, v in d.items() # `d` is your dict

axis=1

)

pd.get_dummies(df.stack()).sum(level=1).clip_upper(1)

111 222 333 444 555 666 777

121212121 1 1 1 1 0 0 0

212121212 0 1 0 0 1 1 0

212123322 0 0 0 0 1 1 1

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39553705

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Python入门：字符转换为二进制及进制之间转换

foryouslgme的博客

07-20

3万+

进制转换函数0、python3.5 1、python中的ord及chr函数指的就是通常意义的unicode，即2个字节 2、UTF-8是1-6个字节的可变长编码方式，常用的英文字母被编码成1个字节，汉字通常是3个字节，只有很生僻的字符才会被编码成4-6个字节''' 下面两句是一样的 str(obj,encoding=‘utf-8’,errors=‘strict’) ''.encode(encod

python浮点数转二进制_在Python中将float.hex（）值转换为二进制

weixin_39884877的博客

12-11

6966

注意0x1.a000000000000p+2的二进制形式不是101.1(或者更确切地说，不是0b101.1)但是0b110.1(在我的Python 2.7中，二进制数是这样显示的)是的。首先，一个有用的浮点实例方法float.hex()及其逆函数，一个浮点类方法float.fromhex()fh = 12.34.hex()print fhprint float.fromhex(fh)结果0x1....

参与评论您还未登录，请先登录后发表或查看评论

python汉字转化为二进制_在python中将字典转换为二进制

weixin_39775029的博客

11-29

883

我对表格有一个口述：a = {(7, 190, 0): {0: 0, 1: 10, 2: 10, 3: 37, 4: 45, 5: 49, 6: 69, 7: 45, 8: 130, 9: 59}}我试着把这个写进二进制格式的文件里。目前我正在使用python2.3我尝试在一个简单的列表中使用struct module，看起来它可以工作，但是当我继续讨论dict时，它抛出一个错误，说require...

python如何把二进制转文本_在python3中如何把文本转换为二进制

weixin_39930276的博客

11-28

752

在python3中如何把文本转换为二进制在python3中把文本转换为二进制的方法：首先修改dirroot为要读取的文件夹的路径；然后遍历所有的文件夹，读取txt文件；最后更改newdirroot为新的目录路径，程序运行完以后会生成和原来一样的目录和dat的二进制文件。当读取读大量数据的时候，为了加快读取的速度，需要将文本文件转为二进制文件。python代码如下：#coding:utf-8#! /...

字典数据存入数据库(转换为二进制)

xpp_xue的博客

06-23

1205

+(instancetype)defaultManager { static DataBaseManager *manager = nil; static dispatch_once_t onceToken; dispatch_once(&onceToken, ^{ manager = [[DataBaseManager

Python模块之pickle（列表，字典等复杂数据类型与二进制文件的转化）

weixin_30773135的博客

12-31

3540

Python模块之pickle（列表，字典等复杂数据类型与二进制文件的转化） 1.pickle模块简介 The pickle module implements binary protocols for serializing and de-serializing a Python object structure。大意是说：pickle...

python怎么编程十进制转化成二进制_python十进制转二进制的详解

weixin_39632467的博客

11-21

4244

python十进制转二进制python中十进制转二进制使用 bin() 函数。bin() 返回一个整数 int 或者长整数 long int 的二进制表示。下面是使用示例：>>>bin(10)'0b1010'>>> bin(20)'0b10100'补充：十进制转8进制和16进制的方法：# -*- coding: UTF-8 -*-# 获取用户输入十进制数dec = int(input("输入数字：...

python文件转二进制_在Python中将文件转换为二进制代码

weixin_39884270的博客

12-22

2411

当然，这是低效的！base64设计用于在文本中存储二进制文件。它在转换后会生成更大的块。顺便问一下：你想要什么样的效率？紧凑性？在如果是：第二个样本更接近您想要的顺便说一句：在你的任务中你丢失了信息！你知道吗？在下面是一个如何存储和恢复的示例。在它以易于理解的Hex-In-Text格式存储数据，只是为了演示。如果你想要简洁-你可以很容易地修改代码以存储在二进制文件中，或者如果你想要00011001...

python进制符号_在Python中将二进制转换为带符号的小端16位整数

weixin_30284477的博客

01-12

1305

尝试将二进制列表转换为有符号的16位小端整数input_data = [['1100110111111011','1101111011111111','0010101000000011'],['1100111111111011','1101100111111111','0010110100000011']]Desired Output =[[-1074, -34, 810],[-1703, -39...

pythonnumpy生成二进制流_Python 读写二进制文件以及Numpy读写二进制文件

weixin_35440082的博客

12-23

3125

1. 什么是.bin文件扩展名为.bin的文件就是一个二进制文件(binary)。不同于文本文件，二进制文件用记事本、Notepad++等打开都是乱码。像是这样：但是.bin文件可以用WINHEX等软件打开。二进制文件里面存储的都是数据，只有按照某个预先设定的规则读出，才能明白这些数字的具体含义。WINHEX将二进制文件内容转为十六进制的形式展现出来：二进制文件相比于文本文件的优点：节约存储空间、...

python二进制转中文_python3 二进制转中文

weixin_32660831的博客

01-14

3114

关于二进制转中文的问题。>>> name = '你好'>>> name'你好'>>> bytes(name,'unicode_escape')b'\\u4f60\\u597d'现在我有一段二进制数据，想要转化成中文。bytes_name = b'\x60\x4f\x7d\x59'我尝试使用bytes_name.decode('unicode_e...

Python中文转换成二进制、八进制、十六进制输出

qq_52674444的博客

07-16

3680

Python中文转换成二进制、八进制、十六进制输出。

Redis Scan迭代器遍历操作原理（二）

weixin_30275415的博客

05-25

190

续上一篇文章Redis Scan迭代器遍历操作原理（一）–基础，这里着重讲一下dictScan函数的原理，其实也就是redis SCAN操作最有价值（也是最难懂的部分）。关于这个算法的源头，来自于githup这里：Add SCAN command #579，长篇的讨论，确实难懂····建议看看这帖子，antirez 跟pietern 关于这个奇怪算法的讨论··· 这个算法的作者是：P...

Python字符串与二进制字符串之间的转换

一条咸鱼

01-20

7558

python任意字符串转二进制字符串

简单搞定python进制转换

forever12li的博客

02-14

7315

python 进制转换及计算原理

python进制转换&字符串转二进制对象&整数转二进制对象&16进制字符串转二进制对象（及其逆转换）

qq_45699846的博客

03-18

6788

python进制转换 && 字符串转二进制对象 && 二进制对象转字符串 && 字符转ASCII（unicode） && ASCII（unicode）转字符 && 二进制对象转整数 && 整数转化成二进制对象 && 十六进制字符串转二进制对象 && 二进制对象转十六进制字符串

python中的字典类型转化为bytes类型,及base64编码中“”双引号和‘’单引号编码结果不同

lwdfzr的博客

12-05

8085

import base64 import json 1. a={"Vod":{"userData":"{}".format("e42e6dedf7a5a3fd19689aeb74bb1605")}} r=bytes('{}'.format(a),'utf-8') print(r) #b"{'Vod': {'userData': 'e42e6dedf7a5a3fd19689aeb74bb160...

python 将字典的键&值从byte类型转换为str类型

oHongHong的博客

07-12

4939

def convert(data): if isinstance(data, bytes): return data.decode('ascii') if isinstance(data, dict): return dict(map(convert, data.items())) if isinstance(data, tuple):

使用python进行十进制和二进制(补码)相互转换

云山233的博客

04-18

5728

使用python进行十进制和二进制相互转换 python中进制转换有专门的函数，如hex,int,oct,bin.见下图. 不过如果我将一个负数使用bin转换为2进制，得到的并不是补码形式。如： >>> bin(-5) '-0b101' 我在硬件实现中需要的是补码的二进制数据。因此，我自己做了一个十进制-二进制转换函数。 def intToBin(number,index,feature=True): """index为该数据位宽,number为待转换数据, feature为True则

python中将十进制转化为二进制