菜鸟练习本
文章平均质量分 83
a_step_further
这个作者很懒,什么都没留下…
展开
-
提取字符串最长子串
思路:第1步:输入两个自定义的字符串第2步:求出所有共同的子串第3步:找到长度最长的子串下面是scala编程版本的实现import scala.collection.mutableobject longestSubstr { def allSubstr(str1:String, str2:String) :mutable.HashSet[String] = {原创 2016-03-25 08:09:33 · 895 阅读 · 0 评论 -
从爬取到展示,数据科学工具串联练手
日常情况下,我们常常是从整洁的数据仓库表中读取数据,进行数据分析,但事实上,数据科学工作往往需要进行数据获取,预处理,分析,展示这样整个的流程。本文从一个实际的案例出来,将不同的分析工具串联起来(虽然仅用一种工具也能实现全流程工作,但不是本文的侧重点),目的是为了体现不同工具的特点和实际使用方法,有利于开拓思路。任务说明从新浪微博上爬取天猫超市微博消息的评论,进行分词,使用文字云的形式进行可视化。...原创 2018-02-24 12:42:40 · 371 阅读 · 0 评论 -
算法学习笔记之插入排序
用插入法进行排序练习步骤:1. 先生成一个随机的数组2. 用插入法进行排序#include #include #include using namespace std;int findInsertPlace(vector v, int value);int main(){ //先生成一个随机数组, 数组长度为N, 元素为100以内的随机整数原创 2017-02-01 19:50:15 · 368 阅读 · 0 评论 -
使用tensorflow对Mnist数据集进行字体识别
上代码:#!/usr/bin/env python#coding:utf-8import tensorflowimport pandas as pdimport skflowtrain = pd.read_csv('~/Mnist/train.csv')X_train = train.drop('label',1)y_train = train['label']class原创 2017-02-07 22:59:17 · 849 阅读 · 0 评论 -
记两则SQL编程中的坑
近期写SQL提取数据时,踩了两个坑。稍做回顾总结,以期对其他人能有所帮助。concat的使用concat用于合并多个字符串,很早以前,一直以为如果输入的参数中有null值,concat会自动忽视之。直到有一次的业务需求开发中,需要合并商品的多个类目信息,最后发现总是有很多类目为空的商品,排查明细后,发现了真相:如果输入concat的众多参数中,只要有一个值为null,最终结果就为null原创 2016-10-15 14:22:28 · 407 阅读 · 0 评论 -
网络爬虫-用python获取豆瓣新书推荐信息
前言: 数据获取是数据分析师的职场必备技能,其中通过网络爬虫,自动、有组织地爬取一些网站数据,既实用,又有趣。本文通过对豆瓣新书速递页面及其子页面的迭代爬取,介绍python3环境下,网络爬虫的入门级用法。 其中的要点在于通过网页元素信息,定位到目标信息的标签格式,然后通过python的一些网络分析包,如 beautifulsoup 来有效提取相关信息。一、要爬取原创 2016-06-11 22:53:26 · 1159 阅读 · 0 评论 -
TCP/IP编程入门-案例学习
前言 从作为一名数据分析从业者,一直不太了解后台开发岗位所使用的各种网络编程方法,于是也就老想闹明白,这个东西究竟是咋玩的? 本文试图通过一个小案例,来管窥下这个领域的编程套路。参考的书籍主要是《TCP/IP网络编程》(尹圣丽 著 金国哲 译)。我们知道,网络编程主要就是实现服务端与客户端的通信,那么就涉及到一系列通信过程的协议,也就是双方要商量好有一套共同的语境。这就又跳到计算机原创 2016-06-10 01:35:34 · 429 阅读 · 0 评论 -
Storm实时计算-新手学习(案例模仿)
前言: 实时计算必将在越来越多的业务场景下得以应用,故而有意学习一番。主要参考《Storm分布式 实时计算模式》一书第1章节《分布式单词记数》。一、要做的事 像mapreduce程序练手时常常用会word count 来演示,这里也用这个需求来演示storm实时计算。即是说,有一个消息源会源源不断地产生一些句子,然后最终的输出结果是所有句子中每个单词的词原创 2016-06-08 18:16:11 · 987 阅读 · 0 评论 -
数据科学案例化学习(julia版本)
前言参考《数据科学实战手册》第2章中汽车燃油效率数据分析的过程,不过原书是用R来进行分析,这里我们通过julia来完成整个分析过程),同时我们也将会进行比原文进行更多的内容拓展, 并在文章中尽可能多地介绍julia进行数据操作的方法,以期达到既走完整个分析流程,又加深了大家对julia的深入了解。文章中所显示的代码如无特殊说明,均指 julia 代码,且工作环境为JuliaPro编辑器。数据科学工...原创 2018-04-10 07:31:12 · 2541 阅读 · 1 评论