Quincy1994
码龄9年
关注
提问 私信
  • 博客:305,810
    305,810
    总访问量
  • 60
    原创
  • 559,001
    排名
  • 241
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:广东省
  • 加入CSDN时间: 2015-08-25
博客简介:

qq_30843221的博客

查看详细资料
个人成就
  • 获得109次点赞
  • 内容获得63次评论
  • 获得652次收藏
  • 代码片获得198次分享
创作历程
  • 2篇
    2019年
  • 27篇
    2017年
  • 26篇
    2016年
  • 8篇
    2015年
成就勋章
TA的专栏
  • liunx学习
    4篇
  • 自然语言处理
    11篇
  • github的学习历程
  • 数据挖掘
    14篇
  • python学习
    5篇
  • 数据库
    10篇
  • c++学习
    1篇
  • java学习
    6篇
  • spark
    6篇
  • 社会网络分析
    2篇
  • 信息检索
兴趣领域 设置
  • 人工智能
    自然语言处理
创作活动更多

仓颉编程语言体验有奖征文

仓颉编程语言官网已上线,提供版本下载、在线运行、文档体验等功能。为鼓励更多开发者探索仓颉编程语言,现诚邀各位开发者通过官网在线体验/下载使用,参与仓颉体验有奖征文活动。

368人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

A3NCF: An Adaptive Aspect Attention Model for Rating Prediction

【论文会议】IJCAI2018【论文作者及机构】(1) Zhiyong Cheng: 南洋理工大学(2) Ying Ding: Vipshop研究院(3) Xiangnan He(何向南): 南洋理工大学(4) Lei Zhu: 山东师范大学(5) Xuemeng Song: 山东大学(6) Mohan Kankanhalli: 南洋理工大学注:何向南是推荐领域的大牛人物,其代表...
原创
发布博客 2019.04.11 ·
1403 阅读 ·
3 点赞 ·
0 评论 ·
7 收藏

关于Fake News Detection的近几年文献列表

前言最近小组内一个师妹的毕业课题是做关于虚假新闻(Fake News Detection)的检测,正好我愁着自己的课程作业要做什么方面的综述,于是灵机一动,就将两个事情拉在一起吧,哈哈。后来借着师妹的手收集了近年来关于虚假新闻的文献(不一定全,请见谅哈),具体如下:AAAIDRIMUX: Dynamic Rumor Influence Minimization with User Exper...
原创
发布博客 2019.02.10 ·
3192 阅读 ·
5 点赞 ·
2 评论 ·
24 收藏

频繁项集与关联规则(英文版)

IntroductionThe study of Finding frequent item-sets and association rules is an important part of Data Mining , which has been widely applied to optimize marketing strategies, enhance the performance o
原创
发布博客 2017.10.22 ·
1933 阅读 ·
5 点赞 ·
1 评论 ·
3 收藏

关于任务二(用户兴趣标注)的总结

前言听完smp比赛各队伍的技术分享后, 回来实验室后用了一周的时间去复刻第一名,第二名关于任务二的做法.任务二的研究对象为csdn技术论坛的用户,根据他们的博客行为和博客内容,以及用户与用户之间的关系,分析用户的主要兴趣点。比赛给定的兴趣标签空间为42个兴趣类别,兴趣类别之间呈现明显的不平衡分布。在这个过程中, 我学习到了非常多的东西. 不过遗憾的是, 到最后也无法达到他们训练出来的效果, 估计某些
原创
发布博客 2017.09.27 ·
1006 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

关于python操作mysql

安装mysqldb包sudo apt-get install MYSQL相关编程代码conn = MySQLdb.connect(host='127.0.0.1',port=3306, user='root',passwd='iiip', db='moviedb',charset='utf8')cur = conn.cursor()sql = "select movie_id from movi
转载
发布博客 2017.08.25 ·
457 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

关于smp的比赛感悟

虽然过去我主持了很多数据挖掘相关的项目, 但smp是我第一次参加的数据挖掘类型比赛.经历了一个多月的煎熬, 我想我也积累了许多宝贵的经验和教训,而这比赛对我最大的锻炼是心态上的成熟, 让我学习了如何在困境中冷静思考,在绝境中寻求希望.迎接新领域与新知识不管是比赛还是项目,我们总会遇到未知的盲区.关于如何冲破盲区, 不同人有不同的看法. 我个人的做法是先寻求这样问题的类似解决方案, 论文或博客, 并记
原创
发布博客 2017.08.17 ·
1144 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

利用Java的Spark做单词统计并排序

import java.util.ArrayList;import java.util.Arrays;import java.util.Collections;import java.util.HashMap;import java.util.List;import java.util.Map;import java.util.Comparator;import org.apache.s
转载
发布博客 2017.07.21 ·
1199 阅读 ·
0 点赞 ·
1 评论 ·
2 收藏

使用scikit-learn做基本机器学习

安装的工具包sklearn: sudo pip install sklearn numpy: sudo pip install numpy scipy: sudo pip install scipy matplotlib : sudo pip install matplotlibsklearn的官网教程http://scikit-learn.org/stable编程代码示范#coding=ut
原创
发布博客 2017.07.11 ·
1898 阅读 ·
1 点赞 ·
0 评论 ·
4 收藏

Python的一些常用方法

python遍历文件夹下的路径import osfor path, dirnames, filenames in os.walk(filepath)python中shell命令执行os.system(shell)
原创
发布博客 2017.07.10 ·
451 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

利用spark的随机森林做票房预测

前言最近一段时间都在处理电影领域的数据, 而电影票房预测是电影领域数据建模中的一个重要模块, 所以我们针对电影数据做了票房预测建模.前期工作一开始的做法是将这个问题看待成回归的问题, 采用GBDT回归树去做. 训练了不同残差的回归树, 然后做集成学习. 考虑的影响因子分别有电影的类型, 豆瓣评分, 导演的 影响力, 演员的影响力, 电影的出品公司. 不过预测的结果并不是那么理想, 准确率为真实值的0
原创
发布博客 2017.05.31 ·
3424 阅读 ·
2 点赞 ·
0 评论 ·
45 收藏

linux的一些基本命令(关于文件操作, 进程操作,以及/boot问题)

文件操作:1.将多个文件合并为单一个文件: cat file1.txt file2.txt > file.txt 2.用sed删除空白行:sed -i ‘/^$/d’ filename 3.用sort加uniq 删除重复项: sort -n filnename| uniq > filename 4.解压 tar zxvf 文件名.tar.gz, 压缩 tar zcvf 文件名.tar.gz 目
原创
发布博客 2017.05.23 ·
446 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

python操作mongodb

#coding=utf-8from pymongo import *IP = "localhost"PORT = 27017class MyMongoDB: '''成员变量''' client = None ##连接数据库的对象 db = None ## 指定的的数据库 collection = None ## 制定的文档 '''构造函数'''
原创
发布博客 2017.05.12 ·
680 阅读 ·
2 点赞 ·
0 评论 ·
1 收藏

mongodb的一些命令操作

关于对mongodb的操作:终端连接mongo命令: mongo关闭数据库:sudo service mongodb stop 开启数据库 sudo service mongodb start关于对文档集合的操作: ( 缺乏键的约束)查看文档集合: show collections; 创建文档集合: db.createCollection(“quincyDB”, {“name”: “qu
原创
发布博客 2017.05.12 ·
585 阅读 ·
0 点赞 ·
0 评论 ·
5 收藏

关于NOSQL的讲义

1 关于NOSQL的介绍问:什么是NOSQL ?NOSQL ,全称为Not Only SQL,不仅仅是SQL,并不是反对SQL的意思(No SQL)。它是针对传统的关系型数据库(RDMB)的不足,提出了全新的数据库管理架构理念。问:为什么会有NOSQL?随着数据规模的不断增长,许多企业需要的数据库架构业务面临以下挑战: (1) 支持大量用户同时在线高并发访问; (2) 在分布式服务架构下能够得到
原创
发布博客 2017.05.11 ·
1039 阅读 ·
0 点赞 ·
0 评论 ·
7 收藏

利用spark的mllib构建GBDT模型

GBDT模型GBDT模型的介绍,我主要是参考博客:http://blog.csdn.net/w28971023/article/details/8240756 在这里,我主要归纳以下几点要素: 1.GBDT中的树都是回归树; 2.回归树节点分割点衡量最好的标准是叶子个数的上限; 3.GBDT的核心在于,每个棵树学的是之前所有树结论和的残差,这个残差就是一个加预测值后能得到真实值的累加量;
原创
发布博客 2017.05.02 ·
2083 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

关于spark的mllib学习总结(Java版)

本篇博客主要讲述如何利用spark的mliib构建机器学习模型并预测新的数据,具体的流程如下图所示: 加载数据对于数据的加载或保存,mllib提供了MLUtils包,其作用是Helper methods to load,save and pre-process data used in MLLib.博客中的数据是采用spark中提供的数据sample_libsvm_data.txt,其有一百个数据
原创
发布博客 2017.04.23 ·
11901 阅读 ·
4 点赞 ·
5 评论 ·
16 收藏

关于在ubuntu下安装使用pycharm

1.安装jdk先下载jdk: https://pan.baidu.com/s/1o7MqvKA 解压到本地: 方法一:直接点击右键,点“提取此文件 方法二:使用命令行sudo tar -zxvf jdk1.8.0_91.tar.gz -C jdk1.8.0_91 复制到指定路径,我使用的是/opt: 命令行:sudo cp -r jdk1.8.0_91 /opt/jdk1.8.0_91
原创
发布博客 2017.04.20 ·
2623 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

关于mysql的安装使用以及java编程

关于mysqlMySQL是一个关系型数据库管理系统那个,关系数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内。MySQL所使用的SQL语言是用于访问数据库的最常用标准化语言。ubuntu 下载与安装mysql sudo apt-get install mysql-server //安装数据库的服务器 sudo apt-get install mysql-client
原创
发布博客 2017.02.19 ·
848 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

关于mongodb的安装使用以及java编程

什么是mongodbmongodb是nosql中的一种,其 将数据存储为一个文档,数据结构由键值(key,value)对组成。MongoDB文档类似于JSON对象。字段值可以包含其他文档,数组及文档数组。 安装mongodb我主要采用的是ubuntu系统,只需输入以下命令行,即可安装mongodbsudo apt-get install mongodb一开始装好系统会自动运行mongodb程序,
原创
发布博客 2017.02.19 ·
1264 阅读 ·
2 点赞 ·
0 评论 ·
2 收藏

利用spark做文本分类(朴素贝叶斯模型)

朴素贝叶斯模型朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集,首先基于特征条件独立假设学习输入/输出的联合概率分布;然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率最大的输出y。至于朴素贝叶斯模型的原理部分,这里就不讲啦,有疑惑的朋友,我推荐看李航的《统计学习方法》中的第四章。我在这里主要谈论的是基于Java版的spark贝叶斯模型。应用场景相对于LR,SV
原创
发布博客 2017.02.10 ·
4775 阅读 ·
1 点赞 ·
3 评论 ·
17 收藏
加载更多