- 博客(324)
- 资源 (10)
- 收藏
- 关注
原创 【Chrome-crx】键盘模拟鼠标点击网页按钮
0x00 前言最近在做一个标注任务: 简单的说,就是屏幕上有好多小方块,选中其中的部分, 然后在页面下面的四个标注按钮(红绿蓝黑)上点一下, 小方块们就会被染成这个按钮的颜色,需要把所有的小方块们染色完。请各位想象一下:纯鼠标工作,在一个白底的网页上来回翻飞舞动,眼睛都看花啦! 所以我决定想个法子把这四个染色按钮绑在我键盘上的几个键上(QWER就是你们了)。 (以后标注起来看起来在打DOTA
2017-10-11 17:12:40 13211 1
原创 【优先队列】百度2018校招编程题—序列合并
0x00 前言又一次当枪手的经历,但是,说实话好久没敲C++了有些手生,一个是freopen传参是啥来着想半天没想起来,一个是居然忘记优先队列的pop是不return的了……此题为:百度2018校招 机器学习/数据挖掘/自然语言处理方向编程题 第2题0x01 题目描述定义函数 f(n)=a7n7+a6n6+a5n5+a4n4+a3n3+a2n2+a1n+a0 f(n)=a_7n^7+a_6
2017-09-27 21:24:20 1086 2
原创 【Pytorch】入门Pytorch,初次上手请多指教
前言本篇为在.ipynb页面上的自学尝试记录, 可以在本人的个人主页上查看或下载自行测试,关于Windows10如何配置Pytorch请移步前篇文章即可~
2017-09-27 08:32:02 1686
原创 【Pytorch】Windows10下配置Pytorch环境
0x00 前言前言什么的也懒得说了…… 总之: 听说你Pytorch很牛, 不乐意让我Windows用, 而我又听说pytorch用来训练模型超好用, 不仅没头脑而且不高兴!我要在我的windows上配一个![NEW] PyTorch在0.4.0版已完美适配Windows,详情请见这篇文章 https://blog.csdn.net/okcd00/article/deta...
2017-09-18 19:24:54 5712 1
原创 【selenium】Windows平台下使用python自动登陆网关 (更新至 v1.1.0)
0x00 前言所里开启了两步验证与二级加密(就不说是哪里了); 以前的auto_login用不了了,所以尝试着有没有什么新法子; 看到一个用 Phantomjs + Selenium 的解决方案,着手试试看好了。
2017-08-29 14:48:36 2100
原创 【列表解析式】Python的单行操作秀
0x00 前言items = [line for line in open('test.txt', 'rb')]通常,我们会在代码中看到一些形似上面的炫目操作(什么你们觉得很正常?好嘛是我菜了QvQ)我一头猛扎进了python的怀抱,正是因为“人生苦短,我用python”,可能是相似的原因,我第一眼就看上了这种表达方式,并且乐于在自己的代码中使用这种方式来更加精简与清晰地生成所需要的列表。
2017-08-11 11:08:41 5243
原创 【选课脚本】用Python网页爬虫来进行选(qiang)课 (更新至v1.0.8)
每当选课的时候,都如同打仗一般 都有自己想要的课,但是名额就那么一点 于是各显神通,有人用js,有人用chrome的console 人生苦短,我用Python
2017-06-01 08:53:18 24478 3
原创 【GraphLite】同步图运算初试-数三角形
0x00 前言图很适合进行分布式并行计算,比如最短路径,PageRank等问题,比较著名的图计算框架有Prege,cmu的GraphLab,apache的Giraph等。GraphLite属于BSP模型。 GrpahLite:https://github.com/schencoding/GraphLite该篇同上篇仅属于备忘式的记录,当前分布式同步图等也具有更为轻量级便捷的写法。0x01 问题描述
2017-05-14 16:18:29 1665 2
原创 【MapReduce Java】简单的平均距离计算
要求没什么太多要说的,以前的MapR in Python用熟练了,Java要不是作业感觉也不会太常用它了…… 就贴一下以备忘(防止以后突然要用java写的时候可以来参考一下)输入文件:文本文件 每行格式 source _ destination _ time3个部分由空格隔开其中source和destination为两个字符串,内部没有空格time为一个浮点数,代表时间(秒为单位)涵义
2017-05-14 15:03:01 1028
原创 【Hadoop & Hbase】大数据存储系统编程_读出写入
0x01 编译环境jdk 1.7hbase 0.98hadoop 2.6Ubuntu Linux 14.04.20x02 目标其中我的任务编号为5,即Sort-based Distinct Sort-based Distinct 根据group by key 排序 然后同一个group的都会在一起 统计输出
2017-05-14 14:48:16 1867
原创 【editdistance】在Windows环境下配置python库editdistance
编辑距离是文本处理中很常见的一种判别相似度的方法, Wikipedia In computer science, edit distance is a way of quantifying how dissimilar two strings (e.g., words) are to one another by counting the minimum number of operati
2017-05-05 14:20:21 6858 10
原创 【TensorFlow】Windows10下配置TensorFlow环境
用TeamViewer中转+VNC连接来图形化, SecureCRT两重ssh跳转来改代码, 以及paste.ubuntu.com来复制粘贴, 这样的日子我已经受够了…… 我要在我的windows上配一个!
2017-05-04 14:01:35 14824 2
原创 【TensorFlow_Fold】深度探究 Blocks for Composition
0x00 前言想写点东西试试,结果接下来就老老实实躺在了Pipeline上; 决定学跑之前先学爬,老老实实啃一下源码和官方文档,虽然官方还在一点点更新,不少地方还是空白的,不过先动起来多敲点试试看,老等着别人喂饭多不好呀
2017-04-21 11:36:26 3463 1
原创 【TensorFlow_Fold】计算图连接初探 Diamond计算图调试历程
先前开了个TFF自学的坑,震惊于计算图连接的陷阱之多,代码之繁,头砸键盘于第二篇文章的Markdown前;进行到计算图不同的block间的连接这一部分,但是td中琳琅满目的函数对输入输出却有着千奇百怪的格式需求,名为TypeError的Exception表示:“你给我走!我不想再看到你!”;调试许久无果,耗时耗电不说,心力即将枯竭……然后在我决定起身去吃饭的时候。。。。。。
2017-04-20 14:57:56 2151
原创 【TensorFlow_Fold】深度探究 Blocks for Input
0x00 前言 想写点东西试试,结果输入就死活搞不定,一万个TypeError; 决定学跑之前先学爬,老老实实啃一下源码和官方文档,虽然官方还在一点点更新,不少地方还是空白的,不过先动起来多敲点试试看,老等着别人喂饭多不好呀; TFF的基本单位之一是Block,看了下Markdown的结构,个人打算按照这个顺序来看看
2017-04-14 16:30:36 2414 2
原创 【TensorFlow_Fold】配置在Jupyter Notebook下的Fold代码环境
TensorFlow_FoldTensorFlow_Fold in Jupyter Notebook 效果预览如上图,环境为 CentOS7 + Python with TensorFlow1.0(Fold include)How to add kernel for Jupyterjupyter里一般是没有我们自己设定的env下的python的
2017-04-07 17:05:56 1661 3
原创 【TensorFlow_Fold】TFF, 初次见面请多指教
TensorFlow Fold is a library for creating TensorFlow models that consume structured data, where the structure of the computation graph depends on the structure of the input data. For example, this mod...
2017-03-23 15:08:30 2432
原创 【VMTool】插件配置——“initctl unknown job”
最近老师布置作业,给了个VMWare10的Ubuntu14.04镜像,想跟以前的Windows虚拟机一样开启VMTools来使用剪切板和文件拖放,结果怎么编译总会出错,调了半天终于装好了,记录一下过程。
2017-03-21 11:56:20 1219
原创 【Theano】环境配置——“g++ not detected”
不管想要做些什么,配置环境总是最让人头疼的部分…… 看了半天的Theano,终于打算跑跑程序瞧瞧了…… 谁知道新的一轮配置才刚刚开始……P.S. 配置过程中的一些摸爬滚打记录一下,赖以之后参考使用
2017-02-07 00:24:03 14073 7
原创 【BootStrap】web前端开发框架初探
0x00 前言0x01 准备环境获取预编译包获取源码及相关配置0x02 使用源码的使用预编译包的使用0xFF 相关资料0x00 前言 Bootstrap 简洁、直观、强悍的前端开发框架,让web开发更迅速、简单。 Bootstrap is a sleek, intuitive, and powerful front-end framewo
2017-01-30 11:22:46 808
原创 2016 CCF-CSP 计算机职业资格认证考试 解题报告
嘛,参加这次考试属于一连串比较机缘巧合的事情——首先是当上了2016年度CCF优秀大学生的荣誉,这个奖颁发的同时也赠予了为期一年的CCF会员资格而会员……是具有一次免费参加CCF计算机职业资格认证考试的机会(就算续费或者再次获得会员资格也只有这一次免费的机会)即便是我已经两年没有敲过C++了,经常会敲成Python的代码习惯……嘛,我就抱着不考白不考的精神——去试试吧 ^_^
2017-01-03 19:38:49 11881 8
原创 【Perception】判别函数·感知器算法
0x00 前言这是中科院(国科大)黄庆明老师的《模式识别与机器学习》课程 (2016Autumn) 中的内容,复习期间为了加深记忆尝试着敲了敲,对于MachineLearning而言,这在判别函数中是一种入门级的算法,作为入门ML的新手,我决定敲一下,于我而言感觉可以更有助于理解~感知器算法感知器算法实质上是一种赏罚过程
2017-01-03 18:50:40 5664 1
原创 【矩阵分解】Python下基于Numpy的四种矩阵基本分解的实现
0x00 需求完成课堂上讲的关于矩阵分解的 · LU、 · QR(Gram-Schmidt) · Orthogonal Reduction Householder reduction Givens reduction 程序实现,要求一个综合程序,根据选择参数的不同,实现不同的矩阵分解。反正也是要写,就顺手做成了实现类,可以import调用的那种,为了写作业方便,也设置了
2016-12-04 22:05:44 15099
原创 【Scipy】在Windows上配置Scipy环境
配环境真乃万事开头难的典范……Scipy是我配了快一万年的东西……(唔,确实对于大多数人来说很简单,但是吾辈是真的经历了千辛万苦,甚至还使用Anocoda来)今天,终于成功了QAQ
2016-12-01 23:05:49 2408
原创 【NMF】用python实现非负矩阵分解
0x00 前言论文阅读理解之—— 《algorithms-for-non-negative-matrix-factorization》 这是一篇网络数据挖掘专业课中,导师推荐阅读的论文,NMF是非负矩阵分解的意思,这种算法旨在针对现实中的问题(图像像素信息等数据往往不会出现负值),将一个N x M的矩阵分解为N x P和P x M两个矩阵,并尽可能的令乘积与源矩阵相近,顺手走了个PPT。
2016-10-29 20:31:27 8454 6
原创 【实现&调用】实现可被简单调用的python函数
0x00 前言本篇破事水@ZoeCUR 在学习WEB安全课程上,有一个对于用户密码的数据分析处理问题,懒惰的孩纸们表示数据处理还是挺麻烦的,吾辈夸下海口10分钟之内搞定然后就有了这段主体部分25行的破事水——需求:读入文件,去重;查询重复条目数;有的文件包含序号前缀,需要去掉;文件多为百兆或GB级别,复杂度要较低。
2016-10-25 19:34:05 1097
原创 【逆序数】哎呀为什么会有人想用QuickSort求逆序数嘛!
(这篇文章底端的图为什么这么大……不管了)[--大家好我们第一个团本CD就通了PT而且打掉了H老一呢,看不懂这行的请当它不存在--]事情,大概是这样的—— (没错这又是一篇我被作业算法血虐的心路历程大水文)哦对了,得先解释一下,逆序数这东西呢,可以理解为冒泡排序的过程中,bubble一次算一次逆序,全部排序完毕之后bubble了多少次,那就是逆序数是多少。官方一点的解释
2016-09-29 00:01:48 112894 22
转载 【获奖纪实】2016年“CCF优秀大学生奖”拟获奖者名单公示
被评为2016年“CCF优秀大学生奖”了~http://www.ccf.org.cn/sites/ccf/xhdtnry.jsp?contentId=2939520257003
2016-08-11 17:14:04 2596 2
原创 【Regex】初试Python下的中文正则表达式
真的是第一次在Python上做正则表达式呀……走了好多弯路,表示自己实在是笨的不行,难得实现了个小Demo,做点备忘好了。 简要概括一下就是:英文正则亲和度蛮高的,随意;中文,转成Unicode再说话!
2016-07-05 12:25:20 2448
翻译 【跨模态推荐】《从在线行为到离线销售》论文翻译
0x00 前言唔,突然看到翻译文章数一直是零……我也来翻译一篇论文好了~ 这篇论文叫作《From online behaviors to offline retailing》是中科院计算所智能计算实验室和百度研究院合作的一篇论文,主要提出了一种跨模态的推荐算法O2OTM。0x01 获取途径CSDN的话好像评论就会给一个积分,所以我都定成了下载只需要一分,以及也可以直接下载不用消耗任何东西,如果翻译
2016-07-03 12:29:46 759 1
原创 【CodeHunt】噢,听说今年的CH又开始了
0x00 前言好难过QAQ,我知道今年的CH的时候已经快结束了…… 到头来只写了第二题这一道题 不行,是时候练练C#了……[16/04/23] 一气呵成地练一个小时好了
2016-04-23 17:48:58 930
原创 【Scikit-Learn】初试开源机器学习工具
啊好久没用Markdown以外的编辑器了,这次随性一点就用xhEditor吧~嘛,写的确实也挺随(luan)性(xie)的23333$ pip install -U scikit-learn$ wget http://scikit-learn.org/stable/_downloads/plot_spectral_biclustering.py$ wget http://sciki
2016-03-17 19:42:05 923
原创 【codecs.BOM】使用Python程序输出csv格式数据
这些天做一个数据处理的任务:要求是输出一个csv格式的文件。每次用NotePad++打开都正常,一用excel打开就一万个乱码,好不容易乱码没了,用作分隔符的逗号也进单元格去了(变成单列了)辛苦的查原因调试代码测试输出过程略去(以后要是有心情再来写好了)……重点是!~把能用的模板记录一下,以后说不定还要用呢QwQ
2016-03-17 18:04:30 6970 3
原创 【ED距离】使用Python求编辑距离
在处理数据相关性的时候,我们时常需要用到编辑距离。 最小编辑距离通常作为一种相似度计算函数被用于多种实际应用,尤其在对于中文自然语言处理中,关于ED距离,百度百科有云: 编辑距离(Edit Distance),又称Levenshtein距离,是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
2016-02-29 15:11:07 2047
原创 【中文编码】使用Python处理中文时的文字编码问题
最近,在处理中文编码的数据的时候,遇到了一些还是令人头疼的问题。 乱码! 乱码!! 乱码!!! 稍微整理一下处理过程,顺带着记录一下解决方案啥的……
2016-02-29 14:40:27 7351
原创 【Echarts】数据可视化_前端页面实现尝试
之前就听说过百度开源了一个数据可视化的项目,叫做Echarts,觉得甚是开心但一直没想起来用过,恰好前几日导师需要做一个数据可视化的东西,简单来说就是做一个热力图,自然就想到了这个,于是现学现卖做好了展示和数据处理,特此撰文记录一下。
2016-01-25 14:10:11 8976
原创 【Jieba】json数据处理-提取与分词
0x00 前言之前说了怎么把数据从数据库里提取出来,然而,我们提取出来的是json串,对于想要进一步处理这些数据的孩纸们而言,还是喜欢用’\t’分割的数据来作训练集吧?(当然会用json.loads()然后当成dict来计算的孩纸们我为你们鼓掌) 最近学校的导师给了这么一个任务,大概就是要做类似的这么一件事吧,写好了所以来这里记录一下~
2016-01-22 15:20:06 5417
原创 【MySQL.Connector】Python下读取数据库信息
最近学了怎么用python把获取到的数据往MySQL的数据库里插入(即MySQLmod.py的实现,关于这个以后有空再写个文章说一说),毕竟数据库的管理数据能力是一绝,但是,我们好不容易插入的数据,如何提取出来呢?
2016-01-22 14:25:00 3515
原创 【初探PHP】安装PHP环境
0x00 前言最近因为工作原因要学学PHP,感觉不错一时半会儿也不知道该写点啥,就记录下怎么配置环境咯……我才不是来水一篇的呢(骗谁呢233330x01 安装PHP环境1、安装libmcrypt1)解压tar -zxvf libmcrypt-2.5.7.tar.gz2)编译./configure --prefix=/home/work/softwar
2016-01-18 14:26:36 516
原创 【Nginx】尝试实现Nginx下的推送模块《Push-Stream-Module》
【Nginx】Nginx下的简易推送功能实现0xFF 目录NginxNginx下的简易推送功能实现0xFF 目录0x00 序言0x01 安装环境GetSrcInstallation0x02 配置简易的推送Client端Server端0x03 配置中可能遇到的问题0x00 序言关于推送,百度百科里是这么解释的: 网页推送,是指将经过整理的信息资源以网页的形式迅速转发至用户的界面,实现
2015-12-03 13:15:42 331
【PSP录制工具】RemoteJoy_Lite_019_CHT
2018-03-25
From Online Behaviors to Offline Retailing
2016-07-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人