python
文章平均质量分 59
Python编程
Rocket,Qian
硕士毕业于同济大学,主要方向是机器学习、深度学习、推荐算法研究以及量化。精通python、MATLAB,熟悉java、C++等编程语言,熟练掌握数据结构与算法、计算机网络,sklearn、XGboost、Tensorflow、pytorch、Keras等框架,分布式系统等。
展开
-
Numpy核心数据结构与DeepLearning常用操作
现在的主流深度学习框架 PyTorch 与 TensorFlow 中最基本的计算单元 Tensor,都与 NumPy 数组有着类似的计算逻辑,所以掌握了 NumPy 对学习这两种框架都有很大帮助。NumPy 是用于 Python 中科学计算的一个基础包。它提供了一个多维度的数组对象,以及针对数组对象的各种快速操作,例如排序、变换,选择等。...原创 2022-06-23 12:40:23 · 506 阅读 · 0 评论 -
2021CCF BDCI图书推荐系统竞赛baseline
2021CCF BDCI图书推荐系统竞赛baseline——itemCF1. 导包2. 读取数据3. 切分数据集4. 计算item相似度5. 生成推荐list6. 生成提交文件比赛地址这是用最基本的基于物品协同过滤算法实现的图书推荐。1. 导包import randomimport numpy as npimport pandas as pdimport mathfrom operator import itemgetterimport logging logging.basicCon原创 2021-11-23 10:31:20 · 2107 阅读 · 14 评论 -
科大讯飞基于用户画像的商品推荐挑战赛Rank5
基于用户画像的商品推荐挑战赛rank5科大讯飞这个比赛终于结束了,初赛和复赛我都是在最后几天开始做的,不到deadline不动手,导致后期想试新算法都没有时间了。最终仅排名第五,略有遗憾!以后还是提早接触好!!!复赛主要解决方案:数据处理根据tagid是否缺失把train和test(复赛数据)分出两部分数据集将复赛数据集的train和test的tagid未缺失用户的tagid序列用来做Word2Vector两层GRUtest中tagid缺失的用户label直接预测为1线下t原创 2021-09-22 22:35:30 · 998 阅读 · 0 评论 -
Python读写文件
Python读写文件1.文件与文件路径1.1 获取当前工作目录1.2 绝对路径与相对路径1.3 os.makedirs()创建新文件夹1.4 os.path 模块2.文件读写过程2.1 用 open()函数打开文件2.2 读取文件内容2.3 写入文件3.用 shelve 模块保存变量1.文件与文件路径1.1 获取当前工作目录import osos.getcwd()1.2 绝对路径与相对路径有两种方法指定一个文件路径。“绝对路径”,总是从根文件夹开始。“相对路径”,它相对于程序的当前工作目原创 2021-07-14 22:08:17 · 116 阅读 · 0 评论 -
Flask入门demo
Flask之Hello World1.flask介绍2. hello world3.登录功能最近接触了机器学习项目线上服务部署相关的东西,想着做一个小的完整的机器学习项目类似于电影推荐那种,考虑到用flask来实现,所以记录下flask的相关知识。1.flask介绍Flask是一个基于Python开发并且依赖jinja2模板和Werkzeug WSGI服务的一个微型框架,对于Werkzeug本质是Socket服务端,其用于接收http请求并对请求进行预处理,然后触发Flask框架,开发人员基于Flas原创 2021-05-21 14:35:45 · 2468 阅读 · 0 评论 -
城市需水预测
城市需水预测-数据探索1. 赛题任务:2. 读取数据3. 处理时间4. groupby比赛地址1. 赛题任务:本赛题要求参赛者利用2018年1月1日-2020年10月31日两大供水厂日供水量明细数据,预测2020年11月1日-2021年3月31日两厂每日供水量。2. 读取数据train = pd.read_csv('train.csv')test = pd.read_csv('test.csv')submit = pd.read_csv('submit.csv')3. 处理时间def原创 2021-05-08 12:26:04 · 994 阅读 · 3 评论 -
python编写一个计算器Demo.exe
计算器demo.exe最近两天在琢磨复利相关的东西,今天突然想用python写一个桌面小软件,花了1个小时写了个简单计算器,并打包成exe软件。import tkinter as tk# 计算功能函数# 追加数字def append_num(i): list.append(i) result.set(''.join(list))# 选择运算符def operator(i): if len(list) > 0: if list[-1] in ['+原创 2021-03-29 15:46:31 · 971 阅读 · 0 评论 -
Python中创建一个二维数组
Python中创建一个二维数组创建n行m列的二维数组:# coding=utf-8def uniquePaths(m: int, n: int): f = [0] * m for i in range(m): f[i] = [0] * n return fprint(uniquePaths(4, 7))def uniquePaths(m: int, n: int): f = [0] * m for i in range(m):原创 2021-03-24 17:42:50 · 589 阅读 · 0 评论 -
天猫用户重复购买预测——数据探索
天猫用户重复购买预测——数据探索1. 理论1.1 缺失数据处理1.2 不均衡样本1.2.1 随机欠采样1.2.2 随机过采样1.2.3 基于聚类的过采样方法1.2.4 SMOTE算法1.2.5 基于数据清洗的SMOTE1.3 数据分布2. 实战数据探索2.1 环境Google colab2.2 导入工具包2.3 读取数据2.4 数据集样例查看2.5 查看数据类型和数据大小2.6 查看缺失值2.7 观察数据分布2.7.1 查看整体数据统计2.7.2 查看正负样本的分布,并可视化2.8 探查影响复购的各种影响因原创 2021-03-02 23:24:15 · 5541 阅读 · 1 评论 -
Python常见知识点记录
Python常见知识点记录2.内置函数2.1 zip() 函数2.2 enumerate() 函数6. 错误和异常6.1. assert7. 库函数7.1 tqdm记录在使用python过程中,常见的有用的一些小知识点,遇到就随手记上,好记性不如烂笔头!!!2.内置函数2.1 zip() 函数zip() 函数用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的对象,这样做的好处是节约了不少的内存。可以使用 list() 转换来输出列表。如果各个迭代器的元素个数原创 2021-01-29 18:03:24 · 100 阅读 · 0 评论 -
工业蒸汽预测
工业蒸汽预测1.导入包和数据2.数据探索EDA2.1画箱型图探索数据2.1 查看数据分布图2.3 合并训练集和测试集数据,并可视化训练集和测试集数据特征分布图2.3.1 可视化线性回归关系2.4 查看特征变量的相关性2.4.1 查找出特征变量和target变量相关系数大于0.5的特征变量3.特征工程4.模型训练5.模型验证6.特征优化7.模型融合最近在看阿里天池的这个工业蒸汽预测比赛项目,顺便把看到的整理下来,以备不时之需啊!1.导入包和数据import numpy as npimport pand原创 2020-11-10 21:19:51 · 1546 阅读 · 1 评论 -
python从函数到高级魔法汇总笔记
python从函数到高级魔法1.函数1.1 函数的定义1.2 函数的调用1.3 函数文档1.4 函数参数1.5 函数的返回值1.6 变量作用域2. Lambda表达式2.1 匿名函数的定义2.2 匿名函数的应用3.类与对象3.1对象=属性+方法3.2 self是什么?3.3 Python的魔法方法3.4 公有与私有3.5 继承3.6 组合3.7 类、类对象和实例对象3.8 什么是绑定?3.9 一些相关的内置函数(BIF)4.魔法方法4.1 基本的魔法方法4.2 算术运算符4.3 反算术运算符4.4 增量赋原创 2020-11-05 23:04:19 · 602 阅读 · 0 评论 -
Python中的数据结构汇总笔记
Python中的数据结构简介1.列表1.1 列表的定义1.2 列表的创建1.2.1 利用推导式创建列表1.3 向列表中添加元素1.4 删除列表中的元素1.5 获取列表中的元素1.6 列表的常用操作符1.7 列表的其他方法2. 元组2.1 创建和访问一个元组2.2 更新和删除一个元组2.3 元组相关的操作符2.4 内置方法2.5 解压元组3. 字符串3.1 字符串的定义3.2 字符串的切片与拼接3.3 字符串的常用内置方法3.4 字符串格式化4.字典4.1 可变类型与不可变类型4.2 字典定义4.3 创建和访原创 2020-11-05 15:21:00 · 144 阅读 · 0 评论