基于同城同校的推荐--(1)

 

import mysql.connector

conn=mysql.connector.connect(host='',user='',password='',port='',database='')
#远程连接
cursor=conn.cursor() 
cursor.execute('select * from table')
#执行sql语句操作
t=cursor.fetchall()
#返回读取的所有行
df=pd.DataFrame(t,columns=[,])
#转为dataframe
#填充nan法1
udf.loc[np.isnan(df.C),'C']=-1

#dataframe.astype(int)---数据框修改列类型
df=df.fillna(-1)#---------------填充nan法2

cursor.close()#关闭sql连接

 

data=data.combine_first(df)#df填补data的缺失项

data=pd.merge(data,user_df,on='C')#data与df根据C列,合并,列增多。

https://www.cnblogs.com/bambipai/p/7668811.html

python pd合并数据:

1. pandas.merge和实例方法join实现的是列之间的连接,以DataFrame数据结构为例讲解,DataFrame1和DataFrame2必须要在至少一列上内容有重叠,index也好,columns也好,只要是有内容重叠的列即可,指定其中一列或几列作为连接的键,然后按照键,索引DataFrame2其他列上的的数据,添加DataFrame1中。通过设置merge参数'on','left_on','right_on'可以指定用来连接的列(即关键的重复内容列),也可以将index作为连接键,只要传入left_index=True或right_index=True(或两个都传)来说明索引被用作连接键。

2. 实例方法join默认通过index来进行连接。

join方法也可以通过列来连接,同样设置参数‘on’即可。

3. 上面介绍的函数实现的均是列之间的连接,要实现行之间的连接,要使用pd.concat方法。

concat默认在axis=0上工作(沿着负y轴的方向),当设置axis=1时(沿着x轴的方向),它同时也可以实现列之间的连接,产生一个DataFrame。

4. 最后一个实例方法combine_first,它在为数据“打补丁”:用参数对象中的数据为调用者对象的缺失数据“打补丁”。

简单总结来说,通过merge和join合并的数据后数据的列变多,通过concat合并后的数据行列都可以变多(axis=1),而combine_first可以用一个数据填充另一个数据的缺失数据。

recommend_list.py----建立海外用户的数据框,建立所有有性别有地址信息的用户的对列

from sql import city_df #跨模块直接使用sql.py中的变量,但是可能会造成重名。

user=df[(df['C1']>3)|(df['C2']>1)|(df['3']>2)]#多条件筛选

abroad_user=df[(df==-1).astype(int).sum(axis=1)<7]#筛选出df中存在项为-1的,且-1个数小于7个的行(按行进行)

df=df[~(df.C.isin(abroad_user))]#df减去df中列C存在于abroad_user中的行

#按行遍历df
for index_x in df.index:
    if df.loc[index_x,'C']!=-1: 
        i=df[df['C']==data.loc[index_x,'C']].index#返回符合条件记录的index
        df.loc[index_x,pro]=df.loc[i,'C_P'].values#返回此项的值,并赋值给其他df中的一项

#df中某一项的值必须用df[i,'C'].values显示


columns_key=('c','a')#dict的key必须是tuple(不可变),不能是list
c_values=(8,2)
columns={columns_key:columns_values}#建立dict
for k,v in columns.items():#遍历dict:dict.keys()或者dict.values()或者dict.items()
   for i in range(7):
       if user.values[0][v[i]]!=-1:#某一行user的列值.values[0],具体第几个值[num]
             a=user.values[0][v[i]]
             r=list(r[r[k[i]]==a].C.values)#r[k[i]]--根据列名查找
             for rec in r:
                 r.append(rec)#将查找的值append进list

           
    list_1=[]#list去重,并保留顺序
    for i in r:
        if i not in list_1:
            list_1.append(i)
    #去重,不保留顺序:
        #list(set(list_1))
        #或者
        #import itertools
        #list_1.sort()
        #it = itertools.groupby(list_1)
        #for k, g in it:
        #print k

#dict追加键值对dict.setdefault(key,value)
dict={}
dict.setdefault(key,values)

main.py--输入d,输出推荐列表

from collections import deque#双头对列
import random#随机


class User(object):#定义calss
    def __init__(self,id):
       self.id=id      
       if self.id in dict.keys():#建立对列deque(list)
           que=deque(dict.get(self.id))#dict中,根据key值返回对应values值   
           #对列长度len(deque)
           que.extend(r[c])#在队列尾追加对列
           random.sample(list,count)#在一个可迭代对象类型中中随机选择count个不重复的值


#class的__call__(self)方法,将方法变为属性,可以直接调用实例,就能运行方法。                               
    def __call__(self):
        que.popleft()#从队列左侧弹出
        que.insert(index,object)
           
if __name__=='__main__':
    id=input()   #input输入为str     
    user=User(int(id))      
    user() #调用call

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
C语言是一种广泛使用的编程语言,它具有高效、灵活、可移植性强等特点,被广泛应用于操作系统、嵌入式系统、数据库、编译器等领域的开发。C语言的基本语法包括变量、数据类型、运算符、控制结构(如if语句、循环语句等)、函数、指针等。在编写C程序时,需要注意变量的声明和定义、指针的使用、内存的分配与释放等问题。C语言中常用的数据结构包括: 1. 数组:一种存储同类型数据的结构,可以进行索引访问和修改。 2. 链表:一种存储不同类型数据的结构,每个节点包含数据和指向下一个节点的指针。 3. 栈:一种后进先出(LIFO)的数据结构,可以通过压入(push)和弹出(pop)操作进行数据的存储和取出。 4. 队列:一种先进先出(FIFO)的数据结构,可以通过入队(enqueue)和出队(dequeue)操作进行数据的存储和取出。 5. 树:一种存储具有父子关系的数据结构,可以通过中序遍历、前序遍历和后序遍历等方式进行数据的访问和修改。 6. 图:一种存储具有节点和边关系的数据结构,可以通过广度优先搜索、深度优先搜索等方式进行数据的访问和修改。 这些数据结构在C语言中都有相应的实现方式,可以应用于各种不同的场景。C语言中的各种数据结构都有其优缺点,下面列举一些常见的数据结构的优缺点: 数组: 优点:访问和修改元素的速度非常快,适用于需要频繁读取和修改数据的场合。 缺点:数组的长度是固定的,不适合存储大小不固定的动态数据,另外数组在内存中是连续分配的,当数组较大时可能会导致内存碎片化。 链表: 优点:可以方便地插入和删除元素,适用于需要频繁插入和删除数据的场合。 缺点:访问和修改元素的速度相对较慢,因为需要遍历链表找到指定的节点。 栈: 优点:后进先出(LIFO)的特性使得栈在理递归和括号匹配等问题时非常方便。 缺点:栈的空间有限,当数据量较大时可能会导致栈溢出。 队列: 优点:先进先出(FIFO)的特性使得
C语言是一种广泛使用的编程语言,它具有高效、灵活、可移植性强等特点,被广泛应用于操作系统、嵌入式系统、数据库、编译器等领域的开发。C语言的基本语法包括变量、数据类型、运算符、控制结构(如if语句、循环语句等)、函数、指针等。下面详细介绍C语言的基本概念和语法。 1. 变量和数据类型 在C语言中,变量用于存储数据数据类型用于定义变量的类型和范围。C语言支持多种数据类型,包括基本数据类型(如int、float、char等)和复合数据类型(如结构体、联合等)。 2. 运算符 C语言中常用的运算符包括算术运算符(如+、、、/等)、关系运算符(如==、!=、、=、<、<=等)、逻辑运算符(如&&、||、!等)。此外,还有位运算符(如&、|、^等)和指针运算符(如、等)。 3. 控制结构 C语言中常用的控制结构包括if语句、循环语句(如for、while等)和switch语句。通过这些控制结构,可以实现程序的分支、循环和多路选择等功能。 4. 函数 函数是C语言中用于封装代码的单元,可以实现代码的复用和模块化。C语言中定义函数使用关键字“void”或返回值类型(如int、float等),并通过“{”和“}”括起来的代码块来实现函数的功能。 5. 指针 指针是C语言中用于存储变量地址的变量。通过指针,可以实现对内存的间接访问和修改。C语言中定义指针使用星号()符号,指向数组、字符串和结构体等数据结构时,还需要注意数组名和字符串常量的特殊性质。 6. 数组和字符串 数组是C语言中用于存储同类型数据的结构,可以通过索引访问和修改数组中的元素。字符串是C语言中用于存储文本数据的特殊类型,通常以字符串常量的形式出现,用双引号("...")括起来,末尾自动添加'\0'字符。 7. 结构体和联合 结构体和联合是C语言中用于存储不同类型数据的复合数据类型。结构体由多个成员组成,每个成员可以是不同的数据类型;联合由多个变量组成,它们共用同一块内存空间。通过结构体和联合,可以实现数据的封装和抽象。 8. 文件操作 C语言中通过文件操作函数(如fopen、fclose、fread、fwrite等)实现对文件的读写操作。文件操作函数通常返回文件指针,用于表示打开的文件。通过文件指针,可以进行文件的定位、读写等操作。 总之,C语言是一种功能强大、灵活高效的编程语言,广泛应用于各种领域。掌握C语言的基本语法和数据结构,可以为编程学习和实践打下坚实的基础。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值