工作总结
文章平均质量分 90
周工作总结,最近的收获与遇到的困难。
一只勤奋爱思考的猪
爱记录、爱分享、爱学习、希望多多留下自己思考过疯狂过的痕迹!
展开
-
centos7下源码编译安装python3.8
0.简介centos7下源码编译安装python3.8(3.7+版本均可),3.6可通过yum安装(yum install python36)略。。。Centos安装Python3.8centos7下源码编译安装python3.8(3.7+版本均可),3.6可通过yum安装(yum install python36)略。。。1.安装编译相关工具准备工作,每台机器运行过一次即可yum -y groupinstall “Development tools”yum -y install zlib-d原创 2022-05-08 10:02:27 · 3070 阅读 · 0 评论 -
企业风险预测开发复盘总结
企业风险预测开发复盘总结一、背景介绍在企业信用领域,每个企业每天都在发生着改变,这些改变有可能使得企业越来越好,也有可能使得企业面临各种风险。面对企业的百万级运营数据,从中分析出企业的风险信息对企业运营的决策和投资者都是比较好的参考。为了给客户提供一个比较精确企业风险信息,我们可以根据企业的历史数据和后面的表现情况,结合数据挖掘的理论知识,采用树模型分类算法模型来预测企业发生风险概率。二、简介结合实际,我们主要围绕两方面工作,第一是数据准备工作,主要是因子体系的梳理和加工,第二是实现评分卡模型。原创 2020-06-14 23:18:09 · 608 阅读 · 0 评论 -
2018-4-29(五一节的第一天/学业/最近实习工作总结)
今天,首先说说学业方面的事吧:将论文排修稿搞定了,很是挣扎中做完的,虽然很不喜欢做这些很是无聊的事,无奈被逼着这样必须去完成,心里默默感叹:人呀,获得自由是有多重要,自由到能让你有能力不做自己不愿意做的事,以后向着这个目标出发吧;接着,再总结下最近实习方面的一些经历:觉得自己知识比较匮乏,缺乏系统的学习某个东西,遇到新需求,新的处理方式的时候有点捉襟见肘,需要反复求助别人,感觉很是不好意思,说说自...原创 2018-04-29 21:41:39 · 157 阅读 · 0 评论 -
2017年最后一天对初踏入社会的一些感悟
2017-12-31今天是2017年最后一天,回首这一年来走过的路,更多的是收获,收获了真心与理解,收获了鼓励与自信,也收获了淡薄与冷静、虚伪与谨慎;在这一年里,在学习中,有了更多自己的思考与计划,也许是经历了对自己不喜欢的学习任务的无奈与厌恶,所以才更知道能有自己能力学自己所喜爱的方向的珍贵与不易,所以,相比经历一番思想斗争与人际挣扎后,我更感恩,感恩这番经历让我成长了,让我更加明白了自己需原创 2018-01-27 17:31:22 · 819 阅读 · 0 评论 -
2018-1-21周总结
(1)完成数据的统计;看清每一张表的具体限制!!!具体限制罗列出来!!!与项目经理确认;数据统计的时候要实现的功能;SQL语句;group by后面可以跟两个条件,在紧接着也可以写order by再跟对应的group by后面的多个限制字段;注意写csv文档的理解,保存成csv格式的代码,加强寻找资料的能力,找官方文档,不要随意百度!!!费时且不易理解!!写csv的时候注意理解原创 2018-01-27 17:28:44 · 172 阅读 · 0 评论 -
工作中做的一个数据交付项目总结
标题项目的形式依托第三方数据源,以及公司爬虫数据、政府合作数据,按甲方的需求字典清洗字段并进行定时推送。项目的难点(1)数据清洗,处理(2)数据更新考虑到外部第三方的数据的问题,做定时轮询取数据做处理—通过接口;(3)数据交付的问题 –通过sftp服务交付;用到的组件与开发技术点PG:连接、存取数据、唯一索引python:接口取文件,保存文件,读取文件,原始文件保留入pg库备份;...原创 2019-12-28 16:29:13 · 1634 阅读 · 0 评论 -
2018-3-3周总结
这周主要做了模型训练和离线数据统计,模型训练:由于正样本:负样本大约为11:1,因此主要是分配数据方式不一样,一种是按全量正负样本1:1,训练测试集3:1;另一种是按训练集中正负样本:1:1,测试集中全为正样本;用的是LGBM,图中遇到模型特征重要度跟平常不太一样,不是处于0-1之间,但翻看python api源码得知,其返回就是一个计算重要度得到的值;另外调试代码的时候注意,遇到除了本文件之外文...原创 2018-03-03 08:53:30 · 223 阅读 · 0 评论 -
周总结
本周做了两个方面的事情:1)不区分行业排名,行业概率区间,最后一个遍历不了,放到与for循环平级的那一层输出;2)区分行业的排名;行业为大行业;首先是copy 2011_hycode.csv,用的是open,因为没有列名,直接一行一行的读,通过line[0],line[1]进行取每一行对应的列;还有关于list[0][:2]取值问题,如果list=['1','2','3'],则list[0][:2...原创 2018-03-09 20:03:17 · 133 阅读 · 0 评论 -
2018-2-10 --实习工作总结
今天是春节前的最后一个周六,一晃又过了一个年头,本周也经历了关于人事与技术方面的挑战,先说人事吧,自己比较大大咧咧,说话时候爱夸张,正话反说,热闹了德高望重的“前辈”,导致他对我也很不客气,有意见,虽然最后和解了,但还是要吸取教训,告诫自己:你要知道并不是所有人都能接纳你这种大大咧咧说话比较逗的人,对于那些稍微严肃的人,就应当学会收敛点,要知道切换自己的交流模式;再说一下技术方面的吧:本周主要是将...原创 2018-02-10 11:35:22 · 188 阅读 · 0 评论 -
2018-2-4--周工作总结
今天立春了,今天是周日,没有加班,又到了该总结这一周工作的时候;这一周主要做了一个事情:就是准备前辈的训练数据,在这个过程中,用到了数据合并的技术,我的解决思路:将每个子表统一成相同字段结构,由于前辈又有新的需求,需要加一个uuid自动更新id索引的字段,所以一部分小的表就是通过collect之后,将子表一行一行读取出来,添加上uuid这个函数生成想要的索引字段;另一部分表由于数据量太大,大约有2原创 2018-02-04 22:05:17 · 282 阅读 · 0 评论 -
2018-1-27工作周总结
2018-1-27本周工作总结:本周主要做ETL数据的特征提取,根据数据,凭借自己直觉以及对数据本身的定性的了解,主观设定一些特征项目,并进行实现;实现的大致流程:对每一个表中的特征进行分类定义:布尔型以及数值型(频率型),统一它们的变量名称,在此基础上,利用sql语句进行提取,本周学到的比较有特色的一个sql语句:即求不同企业的三年内发明专利个数:在表里面有可能存在相同的行,因此需要去重原创 2018-01-27 21:40:45 · 671 阅读 · 0 评论