自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

gengyanpeng's csdn blog

仅供学习,如果侵权请联系删除

  • 博客(29)
  • 收藏
  • 关注

原创 Postgresql 重装

Postgresql 版本10安装

2022-06-22 09:31:36 647 1

原创 阿里云产品

数加智能市场看作大数据与AI领域的“淘宝”交易平台帮助开发者基于Dataworks和PAI去开发应用,并且将应用售卖给更多用户帮助有业务需求的客户,在市场中找到解决自己问题的答案市场不光承载着数据产品的交易功能,更多地还承载着培养整个生态的使命提供了认证、培训和论坛三大板块机器学习PAIPAI-AutoLearning 自动化建模平台PAI-Studio 可视化建模和分布式训练平台,内置AutoML自动调参引擎(Grid search、Random search两种传统调参模式,基于P

2021-05-10 22:46:14 200

原创 软技能-代码之外的生存指南 学习笔记

Soft Skills: the software developer’s life manual这本书是美国的一个软件开发人员写的,但是书中除了有Java、C# 几个单词外,没有一行代码,因为这本书讲的是代码之外的东西。个人觉得适合所有职场的人观看,可以挑选自己感兴趣的看,会给我们一些启发。文章目录第2章 转变思维模式第3章 思考未来第4章 人际交往能力第5章 破解面试之道第6章 列出就业选择第7章 你属于那类第8章 选择公司:幸福感、存在感、归属感第9章 攀登晋升阶梯第10章 成为专业人士第11章

2021-03-07 10:33:28 476 2

原创 平台建设思路学习

文章目录平台需求管理平台设计产品验证平台协同平台中人性对抗跨界平台产品经理的挑战和成长xmind 免费转 markdown 工具鉴于微信智能显示二级目录,阅读体验较差,在该平台重发一次。显示效果明显好于朋友圈。平台建设的7大问题:蚂蚁AI平台实践深度总结平台A/B测试平台机器学习平台金融知识图谱平台NLP平台(NLP)智能文案平台智能生成千人千面的营销文案过去,一直在迭代产品、提升算法能力,力图生成更加智能、精准和个性化的文案。产品经理不能干等,于是,我们的产品经理同学就去把一些市场

2021-03-04 11:07:08 445 1

原创 各种常用排序算法

参考资料:菜鸟教程排序方法时间复杂度(平均情况,最好情况,最坏情况)空间复杂度稳定性冒泡排序O(n2),O(n),O(n2)O(n^2),O(n),O(n^2)O(n2),O(n),O(n2)O(1)O(1)O(1)稳定选择排序O(n2),O(n2),O(n2)O(n^2),O(n^2),O(n^2)O(n2),O(n2),O(n2)O(1)O(1)O(1)不稳定插入排序O(n2),O(n),O(n2)O(n^2),O(n),O(n^2)O(n2),

2020-11-29 19:46:12 88

原创 技术指标学习

本文为技术指标讲解,不构成投资建议;股票有风险,入市需谨慎!本文为技术指标讲解,不构成投资建议;股票有风险,入市需谨慎!本文为技术指标讲解,不构成投资建议;股票有风险,入市需谨慎!import psycopg2import tushare as tsimport numpy as npimport pandas as pdfrom pandasql import sqldfimport matplotlib.pyplot as pltfrom sqlalchemy import creat

2020-09-02 18:55:19 724

原创 Logistic model

逻辑回归模型回归即$y=f(x)$表明自变量与因变量的关系最简单的回归是线性回归$h_\theta(x)=\theta^Tx$缺点:对异常值敏感,主要是由于线性回归在整个实数域内敏感度一致,而分类范围,需要在[0,1]逻辑回归:将预测值限定为[0,1]间的一种回归模型逻辑曲线在z=0时,十分敏感,在z>>0或z<<0处,都不敏感,将预测值限定为(0,1...

2019-03-15 14:19:44 1322

原创 卡方检验的特征选择

卡方检验是特征选择中常用的算法之一。卡方分布(chi-square distribution):定义:若k个独立的随机变量$z_1,z_2,…,z_k$,且$z_i$~$N(0,1)$(i=1,2,…,k), 则这k个随机变量的平方和$Z=z_1^2+z_2^2+…+z_k^2$为服从自由度为k的卡方分布,记为:$Z$~$x^2(k)$卡方分布的期望:$E(x^2)=n$, 方差:$D(...

2019-03-10 10:21:29 7519

原创 Scala study

书名:Scala 学习手册/(美)Swartz,J. 著;苏金国等译。–北京:中国电力出版社,2016.2第1章 概述输出:println("hello world!"),String 字符为双引号,Char 字符为单引号REPL:Read,Evaluate,Print,Loop.可以跨会话存储up 箭头:上一行命令每一行的输出resultREPL 会用一个常量变量保存:res0,re...

2019-03-10 10:17:35 344

原创 kmeans-用户分层

业务场景随着信贷产品上线半年后,前期根据用户基本信息、订单数据、充值数据、授信数据等进行授信不能满足大额用户的需求。为了更好的服务客户,需要针对不同场景进行精细化运营。解决以下问题:控制信贷风险,减少损失满足客户信贷需求,提升用户满意度为此提出对平台各个用户根据规模数据提前对用户进行分层,然后套用之前授信模型,对用户进行授信。以下只讲述一些思想和方法,具体数据不方便透露,代码网上很...

2019-03-10 10:14:28 1903 3

原创 mysql 学习

语法语法distinct:去重,置于开头,distinct 后面存在唯一值字段,如id 时失效。group by:分组时,含有非聚合字段,选择 表 分组字段的第一条记录。此为特色SELECT code,content,ctimefrom hp_reportGROUP BY content...

2018-07-20 17:35:20 168

原创 Postgre SQL

python 操作数据库: postgresql数据库操作语句类型(DQL、DML、DDL、DCL)简介rank() over, dense_rank(), row_number() 的区别时间格式化获取系统时间函数获取当前完整时间:select now()/select current_timestamp获取当前日期:select current_date获取当...

2018-03-21 10:03:25 570

原创 办公软件 office

但凡拥有梦想的人,他们都不做选择题,而只做证明题。word链接文档word文档中的图片如何批量居中简单操作打印要点:转pdf -> 标记页数word 拆分:窗口 -> 拆分 | 右侧滚动条上方小按钮 | ctrl+alt+s显示时间(日期):alt+shift+T(D)定位:ctrl + Gword 魔法符号表情::...

2018-03-09 09:25:40 497

原创 廖雪峰 JavaScript 学习笔记

JavaScript教程JavaScript是世界上最流行的脚本语言,JavaScript是一种运行在浏览器中的解释型的编程语言。在Web世界里,只有JavaScript能跨平台、跨浏览器驱动网页,与用户交互。新兴的Node.js把JavaScript引入到了服务器端,JavaScript已经变成了全能型选手。JavaScript确实很容易上手,但其精髓却不为大多数开发人员所熟知。编写高质量

2018-03-04 15:32:53 3581 2

原创 Welcome To ZOE's Blog

2017-10-29 【经验】从外网访问内网服务器:安装到使用一站通 2017-09-25 【笔记】Docker 入门手册 2017-09-20 【笔记】Shell 基础知识 2017-09-15 【笔记】Linux 基础知识 2017-09-10 【笔记】全基因组测序分析流程(一) 2017-08-27 【笔记】全基因组测序分析之概述篇2017-08-23 【笔记】测序原理

2018-02-09 17:10:15 216

原创 SQL 学习笔记

查询前一天数据及时间统一mysql 1. 前一天日期格式化:SELECT date_sub(curdate(),interval 1 day) , curdate() 2. 时间格式化:SELECT DATE_FORMAT(CURDATE(),'%Y-%m-%d') 3. 离散时间按天选取:order_time BETWEEN date_sub(curdate(),interval 7 ...

2018-02-08 09:29:58 493

原创 Interesting project

githubPDFTabExtract: 一组从PDF文件中提取表的工具,有助于对扫描文档进行数据挖掘[Github上722颗星]。Surprise v1.0: 建立和分析推荐系统的Python scikit**[Github上1103颗星] Clairvoyant识别和监控短期股票走势的历史线索的Python程序[Github上1159颗星]。由Anthony Federico提供s

2018-01-17 20:02:43 345

原创 spider 经验

手法 1. 考虑到要更换 ip 池:主程序每12分钟后终止一次,更新一次ip池 2. 航班过零点,考虑到每条更新完整度,让写入数据库时间比实际小 1.8h ,0.2h 写入当天数据 3. 在凌晨2-6之间代码不工作 4. 代理ip 请求失败超过50次时,用本机请求 5. 每隔一段时间新增一批代理ip,并将请求失败的代理ip删除 6. 考虑代码的迁移性,数据库打开后正常关闭 7. 对爬取

2017-12-15 08:54:05 212

原创 Tensorflow

基本概念计算机视觉比赛 ILSVRC(ImageNet Large Scale Visual Recognition Challenge)使用的数据集都来自ImageNet,其拥有1500w张标注过的高清图片,22000类别,100w标注了定位边框。每年度 ILSVRC比赛数据集拥有120w图片。 浅层学习(Shallow Learning) ILSVRC 2015年冠军152层ResNe

2017-12-04 11:01:57 309

原创 pytorch

pip install http://download.pytorch.org/whl/cu80/torch-0.2.0.post3-cp27-cp27mu-manylinux1_x86_64.whl pip install torchvision

2017-11-23 23:37:10 335

原创 caffe 模型

使用Python合并lmdb文件 : http://www.jianshu.com/p/7cdec6514b0c1. faster RCNN python 安装:http://blog.csdn.net/t5131828/article/details/53302503Faster-RCNN+ZF用自己的数据集训练模型(Python版本) http://blog.csdn.net/sinat_3

2017-11-14 10:21:31 348

原创 刘建平Pinard

The page is: 1 The url is: http://www.cnblogs.com/pinard/default.html?page=1 2017-06-22 条件随机场CRF(二) 前向后向算法评估标记序列概率 2017-06-19 条件随机场CRF(一)从随机场到线性链条件随机场 2017-06-13 用hmmlearn学习隐马尔科夫模型HMM 2017-06-1

2017-11-08 18:53:01 8115 2

原创 python 学习笔记

随机整数矩阵生成: np.random.randint(10,size=(3,4))保存excel:writer = pd.ExcelWriter('output.xlsx') df1.to_excel(writer,sheet_name='1逾期数据',index=False,encoding='utf8') writer.save()padas 生成excel 增加sheet表文本分...

2017-10-29 16:39:13 372

原创 DBSCAN 聚类

DBSCAN原理简介DBSCAN详细介绍及python实现sci-kit learn提供了相应的类和API,非常方便简单。http://scikit-learn.org/stable/modules/generated/sklearn.cluster.DBSCAN.html最简单的应用就是一句话: from sklearn.cluster import DBSCAN clf = DBSCAN

2017-10-25 16:57:15 1112

原创 python 数据标准化

def datastandard(): from sklearn import preprocessing import numpy as np x = np.array([ [ 1., -1., 2.], [ 2., 0., 0.], [ 0., 1., -1.]]) print('原始数据为:\n',x) print('method1:指定...

2017-10-25 10:33:16 7246

翻译 Tf–idf term weighting

tf-idf(t,d) = tf(tf,d) * idf(t) where t means terms, d means document.Using the TfidfTransformer’s default settingsTfidfTransformer(norm='l2', use_idf=True, smooth_idf=True, sublinear_tf=False)idf()

2017-10-25 09:39:40 464

原创 chrome 收藏夹链接

风控互联网金融中需要关注的风控逾期指标有哪些?CPS相关术语系统安装Bootcamp Mac 安装Win10 教程(史上最详、最细、最精、最准,保证你一次安装成功)大规模数据处理董的博客Ubuntu14.04下单机版Spark的部署深度学习原理理解 LSTM 网络深度学习和机器学习 Study Materials机器学习...

2017-10-24 20:25:53 597

原创 学习廖雪峰 Git 总结

installcreate repository(like a directory) mkdir learngitcd learngitgit init —到此已建好 git 仓库把一个文件readme.txt放到Git仓库只需要两步第一步,使用命令git add file1 file2,无返回值。注意,可反复多次使用,添加多个文件;第二步,使用命令git commit -m ‘comm

2017-10-15 10:41:35 325

原创 ubuntu16.04 系统初始配置

系统:ubuntu 16.04.01 主机参数:16G 剑龙GL9 i7 7700K/华硕Z270/GTX1080Ti/256G 显卡驱动安装:NVIDIA-Linux-x86_64-375.82.run CUDA 安装:CUDA8.0 cudnn-8.0-linux-x64-v6.0 cudnn 安装一、将ubuntu 相关问题iso镜像写入优盘:ubuntu d

2017-10-13 18:24:57 9030

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除