- 博客(5)
- 收藏
- 关注
原创 用户画像和系统推荐
1.隐语义模型2.word2vector模型在推荐系统当中的应用3.推荐系统评估指标打分系统:均方根,平均绝对误差top n 推荐:准确率(推荐正确的/推荐的)vs召回率(推荐正确的/用户实际浏览的)覆盖率(对平台而言):推荐系统消除马太效应,覆盖率计算商品的曝光率,引入信息商,每个商品曝光的概率一样时信息熵最大多样性(对用户而言推荐item不是单一的):相似度时效性等。。。4.推荐系统(基于内容...
2018-04-19 16:43:07 1332
原创 python-可视化matplotlib和seaborn
1.echart可做出更精美的图片,matplotlib和seaborn可以对数据进行简单的可视化操作2.series或dateframe转化成array使用方法.values,在可视化过程中尽量用np数组的形式3.%matplotlib inline 图是嵌入在notebook里面的不是跳出来一个框的形式4.matplotlib.pyplot作图的子模块5.x = np.arange(0., 1...
2018-04-19 16:22:51 820
原创 pandas操作总结
1.如何转换数据类型:dollarizer = lambda x: float(x[1:])chipo.item_price = chipo.item_price.apply(dollarizer)2.读取表格数据:不仅可以使用read_csv还可以使用read_tableusers = pd.read_table('https://raw.githubusercontent.com/justma...
2018-04-19 15:52:43 859
原创 python读写csv
1.python处理csv数据表import pandas as pdaa=pd.read_csv('chulihangnew20180419.csv',encoding='GBK')#注意这里的encoding有可能出错,csv是GBK或是utf-8b=aa['t3s']list=b.tolist()list_new=[]for str in list: str=str.replace('...
2018-04-19 10:58:03 132
原创 python-mysql的连接操作
1.如何用python连接数据库并进行相关操作import pymysql#数据库的相关信息dbconn=pymysql.connect(host="114.113.151.71",user="fd_data",password="fd_data",port=3306,database='financialdata')#数据库语句sqlcmd="SELECT CODE FROM tbl_fund_...
2018-04-19 10:52:03 168
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人