tiryzheng
码龄12年
关注
提问 私信
  • 博客:166,278
    166,278
    总访问量
  • 7
    原创
  • 1,814,871
    排名
  • 2
    粉丝
  • 0
    铁粉

个人简介:数据爱好者,文本挖掘疯子

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:安徽省
  • 加入CSDN时间: 2012-08-08
博客简介:

tiryzheng的专栏

查看详细资料
个人成就
  • 获得16次点赞
  • 内容获得8次评论
  • 获得67次收藏
创作历程
  • 14篇
    2018年
  • 6篇
    2015年
成就勋章
TA的专栏
  • 文本分类
    6篇
  • 机器学习
    6篇
  • python
    2篇
  • shell常用操作笔记
    1篇
兴趣领域 设置
  • 大数据
    spark
创作活动更多

如何做好一份技术文档?

无论你是技术大神还是初涉此领域的新手,都欢迎分享你的宝贵经验、独到见解与创新方法,为技术传播之路点亮明灯!

352人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

nlp数据博客

https://github.com/hankcs/pyhanlp/wiki/%E6%89%8B%E5%8A%A8%E9%85%8D%E7%BD%AE
转载
发布博客 2018.05.31 ·
274 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

运营笔记

一项围绕着某项业务,借由通过各类互联网手段来建立与用户间的联系,最终实现用户增长、用户活跃度提升或是获得收入等各种特定目的的职能。目的、渠道&工具、手段&工作方法。我建议3岁以内的运营同学最好都关注“我现在能够掌握些什么手段”,以及“我现在到底能对什么样的产出或结果负责”。一个运营从业者在3年往上以后再需要考虑的,基本就是“如何根据业务特征和目的来组合渠道、工具和具体运营手段”的问...
原创
发布博客 2018.05.24 ·
1050 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

基于 Gensim 的 Word2Vec 实践

Word2Vec基于 Gensim 的 Word2Vec 实践,从属于笔者的程序猿的数据科学与机器学习实战手册,代码参考gensim.ipynb。推荐前置阅读Python语法速览与机器学习开发环境搭建,Scikit-Learn 备忘录。Word2Vec TutorialGetting Started with Word2Vec and GloVe in Python模型创建Gensim中 Word...
转载
发布博客 2018.05.05 ·
752 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

[转载]word2vec在工业界的应用场景

这篇文章主要讲应用,不讲原理。通俗的说,word2vec是一种将『词』变成向量的工具,在nlp的场景中『词』是显而易见的,但是在有些时候,什么可以看做『词』和『文档』就不那么容易了。文章目录 [展开]在社交网络中的推荐前东家工作的时候,有一个个性化推荐的场景,给当前用户推荐他可能关注的『大V』。对一个新用户,此题基本无解,如果在已知用户关注了几个『大V』之后,相当于知道了当前用户的一些关注偏好,根...
转载
发布博客 2018.05.05 ·
460 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

NeuralTalk2模型笔记

模型地址:https://github.com/karpathy/neuraltalk2遇到的坑:1.torch安装过程中,文件尺寸不符解决办法:分析缺失哪些包,手动下载2.cudnn版本不对本机环境 ubuntu17.10+cuda8cudnn 一开始下的是6.0版本,后来降级为5.1版本5.1下载地址链接:http://pan.baidu.com/s/1c984eq 密码:wai9安装http...
原创
发布博客 2018.03.27 ·
1526 阅读 ·
0 点赞 ·
3 评论 ·
0 收藏

ubuntu安装torch遇到“文件尺寸不符”的解决办法

 根据官方文档安装torch,http://torch.ch/docs/getting-started.htmlgit clone https://github.com/torch/distro.git ~/torch --recursivecd ~/torch; bash install-deps;./install.sh执行bash install-deps;时产生如下错误:度娘了好久好久...
原创
发布博客 2018.03.20 ·
2348 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

error trying to exec 'cc1plus': execvp: No such file or directory

问题描述:       安装CUDA,配置好环境变量后,python程序中import theano出错:g++: error trying to exec 'cc1plus': execvp: No such file or directory112       这个错误最初出现在编译基于theano的python程序,后来发现在交互模式下import theano时就报错。按照theano官方...
转载
发布博客 2018.03.13 ·
6494 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

ubuntu系统下Bazel的安装

原文链接:https://www.cnblogs.com/jackchen-Net/p/7156763.html1. Install JDK 82. 添加Bazel分发URI作为包源(一次设置)3. 安装和更新 Bazel官方Doc:https://docs.bazel.build/versions/master/install-ubuntu.html使用Bazel定制的APT存储库 (recom...
转载
发布博客 2018.03.07 ·
2967 阅读 ·
1 点赞 ·
0 评论 ·
3 收藏

bazel安装

1.安装chocolatey搜索cmd,用管理员权限打开https://chocolatey.org/install"%SystemRoot%\System32\WindowsPowerShell\v1.0\powershell.exe" -NoProfile -InputFormat None -ExecutionPolicy Bypass -Command "iex ((New-Object ...
原创
发布博客 2018.03.07 ·
3255 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

样本标注工具的使用笔记

labelImghttps://github.com/tzutalin/labelImgDownload and setup Python 2.6 or later, PyQt4 and install lxml.PyQt4查看python版本我的是2.7.8 32位下载32位的PyQt4http://www.jb51.net/softs/548192.htmlPyQt4 for python2....
原创
发布博客 2018.03.06 ·
937 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

linux deb文件安装

dpkg 是Debian Package的简写,是为Debian 专门开发的套件管理系统,方便软件的安装、更新及移除。所有源自Debian的Linux发行版都使用dpkg,例如Ubuntu、Knoppix 等。以下是一些 Dpkg 的普通用法:1、dpkg -i <package.deb>安装一个 Debian 软件包,如你手动下载的文件。2、dpkg -c <packa...
转载
发布博客 2018.03.03 ·
127939 阅读 ·
13 点赞 ·
4 评论 ·
59 收藏

Ubuntu 17.10 + CUDA8.0+cudnn 在GT610 电脑上配置深度学习环境

一、本机环境配置win7+ubuntu17.10双系统,自己配置的杂牌电脑二、安装cuda前的环境检查1.首先查看自己的显卡型号和类型,我的是NVIDIA,GT610(cuda目前只支持NVIDIA的驱动,如果不是,就不要费力了)lspci | grep -i nvidia2.确认自己的显卡是否在支持列表https://developer.nvidia.com/cuda-gpus3.查看自己装的系...
原创
发布博客 2018.02.25 ·
2567 阅读 ·
1 点赞 ·
1 评论 ·
3 收藏

Ubuntu17.10下cuda8.0.run文件下载

wget https://developer.nvidia.com/compute/cuda/8.0/Prod2/local_installers/cuda_8.0.61_375.26_linux-run
转载
发布博客 2018.02.08 ·
531 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

win7系统怎么利用ubuntu17.10安装双系统,亲测成功

原文链接:http://www.win7zhijia.cn/jiaocheng/win7_13526.html正文入下:win7系统用户想自己装双系统,但是不了解具体哪种安装方法比较安全快捷,其实我们可以利用ubuntu来安装,那么win7系统电脑怎么利用ubuntu安装双系统?且看以下的设置步骤。推荐:win7 32位系统下载  一、软件准备  1、下载 Ubuntu 系统镜像:http://w...
转载
发布博客 2018.02.06 ·
295 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

使用 timeit 模块

关于 Python 代码优化你需要知道的最重要问题是,决不要自己编写计时函数。为一个很短的代码计时都很复杂。处理器有多少时间用于运行这个代码?有什么在后台运行吗?每个现代计算机都在后台运行持续或者间歇的程序。小小的疏忽可能破坏你的百年大计,后台服务偶尔被 “唤醒” 在最后千分之一秒做一些像查收信件,连接计时通信服务器,检查应用程序更新,扫描病毒,查看是否有磁盘被插入光驱之类很有意义的事
转载
发布博客 2015.10.11 ·
467 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

《机器学习》学习笔记-第一周

机器学习使用方法及场景:贝叶斯分类器——流失分析:可以把流失用户作为一个样本,里面包含单次使用时长、花费、活跃互动等情况,进行流失预警;贝叶斯分类器+文本挖掘——垃圾邮件过滤,网页文本分类,评论自动分析(好、中、差评):首先准备样本,分词,做TF-IDF矩阵,然后用贝叶斯分类算法计算应该属于哪一类小波分析——OCR,图像识别,语音识别决策树——电脑博弈(有局面标准化,局面评估打分函
原创
发布博客 2015.09.20 ·
570 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Gensim计算两个文档相似度(python)

发布资源 2015.09.19 ·
pdf

gensim文档-相似性查询

原文链接http://cloga.info/python/2014/01/28/Gensim_Similarity_Queries/28 January 2014如果你想要查看logging事件不要忘记设置。import logginglogging.basicConfig(format='%(asctime)s : %(levelname)s : %(mes
转载
发布博客 2015.09.19 ·
2718 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

lsi计算文档相似度

原文链接http://datum.readthedocs.org/en/latest/201308/gensim.html#lsi先准备数据,我爬了约2w篇豆瓣日记作为这次试验的数据,数据和代码可以在这里https://github.com/largetalk/yaseg 找到。主要代码如下:import jiebafrom gensim import cor
转载
发布博客 2015.09.19 ·
3874 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

gensim的LSI模型来计算文档的相似度

[python] view plaincopyfrom gensim import corpora,models,similarities  dictionary=corpora.Dictionary.load('/tmp/deerwester.dict')  corpus=corpora.MmCorpus('/tmp/deerwester.mm')  
转载
发布博客 2015.09.19 ·
1444 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏
加载更多