![](https://img-blog.csdnimg.cn/20201218121954955.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224)
M4. 数分资源平台
数分资源平台
sevieryang
DM/DW/Statistics/Quant
展开
-
国内外公开数据源参考21个
国内公开数据1. 国家统计局国家统计局2. 国家数据国家数据3. 大数据导航大数据导航4. 大数据123大数据1235. 中国民政部中国民政部6. 巨潮资讯巨潮资讯7. 中国互联网信息中心中国互联网信息中心8. 百度指数百度指数9. 微博数据中心微博数据中心补充:国家数据网-中国出生率数据国家数据网:http://data.stats.gov.cn/easyquery.htm?cn=C01&zb=A0302&sj=2016国外公开原创 2021-01-29 10:08:21 · 728 阅读 · 0 评论 -
数分信息图表/新闻可视化汇总(更新)
网易读数(轻量级读数新闻)http://data.163.com/special/datablog/澎湃美数课(设计很好,还有动图和视频)http://www.thepaper.cn/list_25635数据新闻网(收集大量主流媒体的可视化作品,并且有工具库分享,可以当导航网工具网学习网)http://djchina.org/财新数字说http://datanews.caixin.c...原创 2019-03-23 00:08:37 · 875 阅读 · 0 评论 -
数分有趣的案例汇总(更新)
公路商店关于Reddit的文章https://mp.weixin.qq.com/s/-o18MEUPxJqHouEd-OxVlw《数据之美》中提到的案例:Aaron Parecki:从2008年开始记录自己的gps行程https://aaronparecki.com/2012/03/06/7/everywhere-ive-been-gps-data-portraitsTim Clark,...原创 2019-03-23 00:06:33 · 406 阅读 · 0 评论 -
数分工具库网站汇总(更新)
工具库网站:python官网https://www.python.org/pandas官网http://pandas.pydata.org/numpy官网http://www.numpy.org/matplotlib官网https://matplotlib.org/geoplotlib官网和文档https://github.com/andrea-cuttone/geoplotl...原创 2019-03-23 00:05:38 · 189 阅读 · 0 评论 -
Kaggle Faster Data Science Education & coursera
https://www.kaggle.com/learn/overview?utm_medium=email&utm_source=intercom&utm_campaign=data+projects+onboarding原创 2019-02-25 23:49:45 · 246 阅读 · 0 评论 -
Kaggle Public Datasets -- 推荐
https://www.kaggle.com/datasets?utm_medium=email&utm_source=intercom&utm_campaign=data+projects+onboarding原创 2019-02-25 23:47:32 · 964 阅读 · 0 评论 -
【重要】国内外公开数据源参考21个
国内公开数据1. 国家统计局国家统计局2. 国家数据国家数据3. 大数据导航大数据导航4. 大数据123大数据1235. 中国民政部中国民政部6. 巨潮资讯巨潮资讯7. 中国互联网信息中心中国互联网信息中心8. 百度指数百度指数9. 微博数据中心微博数据中心国外公开数据等原创 2021-02-02 14:24:17 · 5920 阅读 · 1 评论 -
train_word2vec
# -*- coding: utf-8 -*-import tensorflow as tffrom gensim.models import Word2Vecfrom gensim.models.word2vec import LineSentenceFLAGS = tf.app.flags.FLAGStf.app.flags.DEFINE_string("cut_word",...原创 2019-03-10 15:33:50 · 437 阅读 · 0 评论 -
RNN
import collectionsimport numpy as npimport tensorflow as tfFLAGS = tf.app.flags.FLAGStf.app.flags.DEFINE_string("poetry_file", "./data/poetry/poetry.txt", "诗集目录")class RobotPoetry(obje原创 2019-03-10 15:34:19 · 282 阅读 · 0 评论 -
d7
import tensorflow as tfFLAGS = tf.app.flags.FLAGStf.app.flags.DEFINE_string("job_name", " ", "启动服务的类型ps or worker")tf.app.flags.DEFINE_integer("task_index", 0, "指定p原创 2019-03-10 15:33:57 · 400 阅读 · 0 评论 -
d6
import tensorflow as tffrom tensorflow.examples.tutorials.mnist import input_datafrom tensorflow.contrib.slim.python.slim.nets.inception_v3 import inception_v3_baseFLAGS = tf.app.flags.FLAGStf...原创 2019-02-28 23:54:04 · 222 阅读 · 0 评论 -
d5
import tensorflow as tfimport os# 模拟一下同步先处理数据,然后才能取数据训练# tensorflow当中,运行操作有依赖性# # 1、首先定义队列# Q = tf.FIFOQueue(3, tf.float32)## # 放入一些数据# enq_many = Q.enqueue_many([[0.1, 0.2, 0.3], ])## # ...原创 2019-02-28 23:53:29 · 131 阅读 · 0 评论 -
d4
import tensorflow as tfimport osos.environ['TF_CPP_MIN_LOG_LEVEL']='2'# 创建一张图包含了一组op和tensor,上下文环境# op:只要使用tensorflow的API定义的函数都是OP# tensor:就指代的是数据# g = tf.Graph()## print(g)# with g.as_defau...原创 2019-02-28 23:52:30 · 342 阅读 · 0 评论 -
d3
from sklearn.datasets import load_bostonfrom sklearn.linear_model import LinearRegression, SGDRegressor, Ridge, LogisticRegressionfrom sklearn.model_selection import train_test_splitfrom sklearn.p...原创 2019-02-28 23:51:42 · 294 阅读 · 0 评论 -
d2
from sklearn.datasets import load_iris, fetch_20newsgroups, load_bostonfrom sklearn.model_selection import train_test_split, GridSearchCVfrom sklearn.neighbors import KNeighborsClassifierfrom sklea...原创 2019-02-28 23:51:07 · 311 阅读 · 0 评论 -
d1
from sklearn.feature_extraction import DictVectorizerfrom sklearn.feature_extraction.text import CountVectorizer, TfidfVectorizerfrom sklearn.preprocessing import MinMaxScaler, StandardScaler, Imput...原创 2019-02-28 23:50:20 · 265 阅读 · 0 评论