- 博客(233)
- 收藏
- 关注
原创 数据大屏开发步骤
简单总结:数据大屏开发就是 “先明确要展示什么,再搞定数据来源,接着设计布局,然后用工具 / 代码做出来,最后测试上线”,核心是让数据 “看得懂、用得上”。分区域:比如大屏顶部放标题和时间,左侧放总览指标(总销售额、总人数),中间放核心图表(趋势折线图、地域分布图),右侧放预警提示;选组件:确定用什么图表展示数据 —— 看趋势用折线图,看占比用饼图,看地理分布用地图,看实时数据用数字仪表盘;定风格:比如政府大屏常用蓝色调、严肃字体,电商大屏常用红色调、活泼风格,避免花里胡哨导致数据看不清。
2025-12-11 16:21:44
908
原创 数据要素估值 VS. 数据要素定价的区别与联系
简单说,数据要素定价是“把数据的‘价值’转化成‘具体价格’”的过程,核心是在估值的基础上,结合买卖双方的需求、市场情况,最终敲定“多少钱能买/卖”,就像给数据贴“最终价签”。简单说,数据要素估值是“算数据到底‘值多少价值’”的过程,核心是用客观方法(比如技术工具、评估模型)算出数据的“内在价值”,就像给数据做“价值体检”。总结:估值是偏客观的“价值计算”,结果可能是一个“价值范围”(比如这份餐饮数据估值在5000-8000元),是后续定价的“基础依据”。
2025-10-15 11:09:08
312
原创 论文学习笔记:《数据要素定价方法研究评述与展望》-欧阳日晖
*2. 定价技术是桥梁:**评估出的 “价值基准”(如 “该数据集信息熵为 10,对应价值 1000 元”),需要通过技术转化为具体价格(比如用定价函数pr(·)=l(H(·))将熵值 10 映射为 1000 元),否则评估只是 “纸上谈兵”;定价技术是将 “评估出的价值” 转化为可计算、可落地的具体价格的技术手段,核心是 “用技术提高定价的效率和精度”,不涉及市场多方的互动,更偏向 “技术执行”。“价值决定价格”,先通过理论模型量化数据的内在价值,再以此为基础推导价格。
2025-10-13 11:26:20
935
原创 公共数据资源价格形成机制难点、收益分配难点
例如,一个基于政府开放数据成功商业化的App,其收益中,政府数据的底层价值占多少?数据定价与流通的前提是合规。再分配:如何通过税收、设立公共数据基金等方式,将部分收益用于弥补数据来源地(公众)、支持数据基础设施建设或扶持弱势群体,是一个复杂的公共政策问题。缺乏可信、可控的数据交易平台和流通环境,使得交易成本高昂,且难以对数据使用情况进行追踪和审计,从而无法支持复杂的收益分成模式。监管与审计挑战:如何对数据交易和收益实现进行有效、低成本的监管,防止利益输送和国有资产流失,是一个巨大的挑战。
2025-10-10 15:51:16
746
原创 理解 “ 数据基础设施 ”
同样地,在数字世界里,数据就是新的“石油”和“生产要素”。而数据基础设施,就是那些为了支撑数据的产生、传输、存储、计算和管理这一完整生命周期所需的一系列技术、设施、标准和服务的总称。“数据基础设施”是一个在数字化时代至关重要的概念,我们可以把它理解成数字世界的“高速公路、电网和水网”。它不再是看得见摸得着的公路和铁轨,而是由代码、软件、硬件和协议构成的底层支撑系统。没有这些,现代经济社会就无法运转。
2025-10-10 10:59:14
178
原创 到底什么叫做 “ 建立公共数据资源授权运营价格形成机制 ”?
政府要制定一套明确的、系统的、公平的规则和方法,来解决“如何给公共数据资源的使用权定价”这个问题,从而让这些宝贵的数据资源能够在授权给企业运营时,既能体现其价值和成本,又能促进数据的有效利用和创新开发,同时防止国有资产流失和确保市场公平。数据的价值不是固定的,它取决于“谁用”和“怎么用”。同样的交通数据,给一个做学术研究的大学生用,和给一个开发自动驾驶技术的公司用,产生的价值天差地别。它指的不是简单地“定一个价格”,而是建立一套完整的、科学的、公平的“规则和体系”来决定这个授权价格应该是多少。
2025-10-10 10:34:45
225
原创 公共数据资源的“整体授权”是什么涵义?
整体授权在公共数据资源授权运营中同时包含两个关键含义:整体授权是公共数据授权运营的主要模式之一,具有以下核心特征:
2025-10-09 17:35:19
197
原创 什么是编程语言?
以下内容摘自《Web前端开发精品课HTML CSS JavaScript基础教程》编程语言我们人类有非常多的语言,例如汉语、英语、法语等。实际上,计算机也有很多语言,例如C、C++、Java等。简单来说,JavaScript就是众多计算机语言(也叫编程语言)中的一种。跟人类语言类似,计算机语言也有一些共性,例如我们可以将C语言代码转化为JavaScript代码,这就像将英语翻译成汉语一样,虽然语言不一样了,但是表达出来的意思是一样的。我们都知道,学习任何一门人类语言,都得学这门语言的词汇、语法和.
2022-04-08 14:20:33
1254
原创 信息孤岛的由来,以及如何改善
文章目录1. 什么是信息孤岛?2. 信息孤岛产生的原因3. 数据中台-让数据用起来什么是数据中台?参考1. 什么是信息孤岛?信息孤岛,顾名思义就是大家就像在一个个岛上,只拥有自己的信息,与其他的岛屿完全没有交流,从而造成信息闭塞,发展缓慢。企业的信息孤岛就是在整个企业内部,各个部门之间信息的不到有效及时的沟通交互,企业管理系统之间在功能上不能关联互助、信息不共享也不能互换以及信息与业务流程和应用相互脱节。信息孤岛是一个普遍的问题,信息孤岛的类型有很多,不仅企业内各环节存在着信息孤岛,企业间也存在信息孤
2022-03-11 11:32:40
6635
原创 用户画像及应用
文章目录用户画像大数据应用场景用户画像运营商在数据获取方面得天独厚。其自身不仅积累了庞大的用户群,而且能够通过多渠道多形式持续性地收集用户通信、身份、上网以及社交等各维度数据,进而形成庞大的数据资源库。大数据应用场景基于网络信令的客户上网行为触点营销,运用云计算等技术构建Hadoop结构的大数据精确营销平台,实时捕获手机上网用户的号码、机型、位置、软件使用、关键字捜索和网站浏览行为等具有营销价值的信息。当客户捜索关注的关键字,或浏览特定网站及栏自,或使用运营商同类功能的软件时,及时触发预设定的场景
2022-03-09 17:11:34
2685
原创 数据的产生
数据产生是数据平台的源头,没有数据,所谓的大数据也无从谈起。所以首先要保证有数据。随着近年来互联网和移动互联网的蓬勃发展,数据已经无处不在,毫无疑问,这是一个数据和信息爆炸的时代。所以,即使一个企业和个人没有数据,通过爬虫工具和系统的帮助,也可以从互联网上爬取到各种各样的公开数据。但是更多的、高质量的数据是爬取不到的,这些数据存在于各个公司、企业、政府机关和机构的系统内部。...
2022-03-09 10:19:11
1990
原创 一文区别数据库、数据仓库、数据湖、数据中台
文章目录前言数据库前言你是否和我一样,对数据库、数据仓库、数据湖、数据中台的概念傻傻分不清楚,明明都是用来存数据,哪来这么多叫法呢。其实,我们首先要明白,任何一种事物的诞生都不是平白无故的,一定是为了解决某一种问题,或者说痛点。在展开介绍之前,不妨先看一下下面这张图,大致清楚它们之间的一个关系。数据库...
2022-02-24 15:39:03
1300
原创 实时计算知识,最详细的整理
随着云计算、大数据等名词的流行,涌现出一大批相关的技术,其中Hadoop是较早出现的一种分布式架构,得到了大量的应用。本章先说明大数据和Hadoop的基本概念,之后介绍HDFS、MapReduce、YARN三个基本的Hadoop组件。除了基本组成部分,Hadoop生态圈中还有很多其他的工具组件,它们可以提供创建数据仓库所需的大部分功能。
2022-02-23 11:11:57
4059
原创 “云“系列概念
“云”系列概念什么是云?何谓云技术何谓云计算?何谓云计算平台?二级目录三级目录什么是云?云和本地是相对的,云可以看作是一个庞大的网络系统。一个云内可以包含数千,甚至上万台服务器;何谓云技术云技术是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。何谓云计算?云计算,是分布式计算的一种,指的是通过网络“云”将巨大的数据计算处理程序分解成无数个小程序,然后,通过多部服务器组成的系统进行处理和分析这些小程序得到结果并返回给用户。传统的应用正在变
2021-07-15 19:34:06
723
原创 常用资料
图神经网络资料https://github.com/thunlp/GNNPapershttps://github.com/Jiakui/awesome-gcnhttps://github.com/joeat1/GNN_notehttps://github.com/weslynn/AlphaTree-graphic-deep-neural-network
2021-03-31 10:59:58
251
原创 《A Survey of Fake News: Fundamental Theories, Detection Methods, and Opportunities》
综述 1 introduction1.1 what is fake news1.2 fundamental theories1.3 an overview of this survey(I) knowledge-based methods(section 2)(II) style-based methods (Section 3)(III) propagation-based methods (Section 4)(IV) source-based methods (Section 5)(VI)In Sec
2021-03-26 14:48:36
548
原创 谣言检测论文+代码
Weak Supervision for Fake News Detection via Reinforcement Learninghttps://github.com/yaqingwang/WeFEND-AAAI20Gephi for graph visualizations https://gephi.org/Fighting an Infodemic: COVID-19 Fake News Dataset: https://github.com/parthpatwa/covid19-fake-.
2021-03-24 14:54:53
2864
3
原创 configure: error: please install libssl-dev or openssl-devel
libssl-dev 、 openssl-devellibssl-dev是一个Linux平台下提供加密安全支持的库文件。安装xrdp时遇到问题:configure: error: please install libssl-dev or openssl-devel解决办法:下载 libssl-dev:https://packages.ubuntu.com/xenial/libssl-dev下载适合自己Ubuntu的文件包,需要版本适合、符合系统:https://ubuntu.pkgs.
2021-01-06 16:37:30
1079
原创 Ubuntu16.04常用包下载地址
网址https://launchpad.net/ubuntu/xenial/amd64https://launchpad.net/ubuntu/xenial/amd64/需要的包的名字示例https://launchpad.net/ubuntu/xenial/amd64/gnome-panel
2021-01-06 16:35:52
819
原创 Win10通过远程桌面连接连接不上Ubuntu16.04(下)
卸载xrdp、vnc4server、xbase-clientssudo apt-get purge xrdpsudo apt-get purge vnc4serversudo apt-get purge xbase-client安装xrdp、vnc4server、xbase-clients1、sudo apt-get install xrdp vnc4server xbase-clients2、手动下载1.xrdp 下载: https://github.com/neutrinola
2021-01-03 17:32:56
1417
原创 Ubuntu镜像源不可用
Ubuntu更改镜像源两种方式:https://blog.csdn.net/laoluobo76/article/details/108302191执行:sudo apt-get update出现错误:dell@dell-PowerEdge-T630:~$ sudo apt-get update忽略:2 https://mirrors.tuna.tsinghua.edu.cn/ubuntu xenial InRelease获取:1 http://ppa.launchpad.net/gra.
2020-12-29 10:27:30
5284
4
原创 Win10通过远程桌面连接连接不上Ubuntu16.04(上)
sudo vi /etc/xrdp/sesman.ini在[Xvnc]下面添加param8=-SecurityTypesparam9=None保存退出,Esc + :wq重启xrdp服务sudo /etc/init.d/xrdp restart
2020-12-28 21:57:53
1900
原创 There was a problem confirming the ssl certificate: [SSL: CERTIFICATE_VERIFY_FAILED]
https://www.cnblogs.com/yinhaiping/p/13375375.html
2020-12-28 21:05:21
2538
原创 pip安装包时,出现UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd5 in position 151:
参考:https://my.oschina.net/jms0755/blog/1612950?tdsourcetag=s_pctim_aiomsg
2020-12-23 11:04:00
3136
1
原创 failed build torch_scatter.whl
参考:win10下python3安装torch_scatter、torch_sparse出错的解决方案:https://blog.csdn.net/wangs1996/article/details/96424937(对我无用)https://github.com/rusty1s/pytorch_geometric/issues/87提供一个whl文件的下载网址:http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml(并没有torch_scatter的)...
2020-12-23 11:02:53
2773
3
原创 加载.npz文件时,出现错误:OSError: Failed to interpret file ‘xxx.npz‘ as a pickle
.npz文件的内容是怎样的,怎么打开?加载.npz文件时,出现错误:OSError: Failed to interpret file ‘xxx.npz’ as a pickle首先了解pickle的定义:pickle: 用于python特有的类型和python的数据类型间进行转换pickle提供四个功能:dumps,dump,loads,loadpickle可以存储所有python支持的原生类型(bool,int,float,string,byte,none等),由任何原生类型组成的列表、元
2020-12-22 16:05:19
11347
2
原创 Pytorch1.1.0 + cuda10.0+torch_geometric
1. 创建一个Pytorch1.1.0的虚拟环境conda create -n (环境名)(python版本)2. Pytorch官网看Pytorch1.1.0的安装命令https://pytorch.org/get-started/previous-versions/# CUDA 10.0conda install pytorch==1.1.0 torchvision==0.3.0 cudatoolkit=10.0 -c pytorch...
2020-12-17 17:21:28
5726
3
原创 运行谣言检测代码时,遇到的一些问题
服务器上装了pytorch,并且在服务器的命令行,import torch是可以导入成功的,但是在pycharm里面导入Pytorch就导入不成功,这是为什么呢?
2020-12-17 10:28:49
408
原创 Ubuntu上操作文件夹
1、pwd:查看当前某个文件的路径记住一个指令最好的方法是,了解它的英文全称. pwd 的英文全称为P : Print 打印W : Working 工作(当前)D : Directory(路径)默认Terminal打开之后,进入的路径是Linux当前用户的主目录.其中所有的用户目录都在linux系统的home路径下, 用户目录以用户的用户名命名. 个人的文件都会放在/home/用户名 这个目录下.2、ls:查看这个当前位置下共有多少个文件夹ls:list directory conten
2020-12-16 10:50:30
764
原创 管理Anaconda环境
怎样查看当前Anaconda版本?conda --version查看当前创建了哪些虚拟环境?conda env list创建一个anaconda环境?conda create -n (环境名)(python版本)例如: conda create -n botnet python=3.6Anaconda怎么把删除的环境删除干净conda remove -n learn --all如何给创建的anaconda环境重命名?conda 其实没有重命名指令,实现重命名是通过clone 完成
2020-12-16 10:24:07
212
原创 生活中的小问题
哈哈,自己用CSDN记录生活,而不是代码程序,着实有点搞笑了.冬天穿大衣,袖子在桌子上蹭,容易起毛怎么办?在网上百度了一圈儿,也没啥好的办法,总的来说,要想使你的袖套不起毛,你可以:脱掉外套(haha)戴上袖套(haha)双十二安排上!...
2020-12-07 09:59:30
325
原创 写论文时候,使用word遇到的基本问题
怎样插入目录https://jingyan.baidu.com/article/e2284b2b381386e2e6118d88.html怎样在想要的页面,使得插入的页码编号为1?https://zhidao.baidu.com/question/399858035.html为什么当我只想删除论文封皮的页码,其他页的页码全没了?首先将删除bai页码页通过插du入分节符使之成zhi为单独一节,然后分别dao断开 该页(节)zhuan 与 前一节、后shu一节 .
2020-12-03 19:25:42
342
原创 社交网络中的恶意行为
什么是互联网账号恶意注册黑产?危害性有多大? https://baijiahao.baidu.com/s?id=1619527302240860414&wfr=spider&for=pc威胁猎人:2017年度中国互联网黑产报告https://mp.weixin.qq.com/s/evGK8v2rjM4IGYODYXFvtA?2018上半年互联网黑产研究报告 https://guanjia.qq.com/news/n1/2382.html...
2020-11-16 22:02:00
392
原创 谣言检测常用资料
全连接层全连接层、softmax的loss :https://blog.csdn.net/u014380165/article/details/77284921
2020-11-05 10:58:23
2197
原创 词向量
用数字表示文本要将自然语言交给机器学习中的算法来处理,通常需要首先将语言数学化,词向量就是用来将语言中的词进行数学化的一种方式,然后再其馈入模型。独热编码对词汇表中的每个单词进行“独热”编码。考虑这样一句话:“The cat sat on the mat”。这句话中的词汇(或唯一单词)是(cat、mat、on、sat、the)。为了表示每个单词,我们将创建一个长度等于词汇量的零向量,然后在与该单词对应的索引中放置一个 1。下图显示了这种方法。为了创建一个包含句子编码的向量,我们可以将每个单词
2020-10-18 15:42:15
439
原创 Ubuntu16.04升级Cuda版本到10.1
必须强调一下,一定检查自己的系统版本、显卡、gcc、Linux内核是否支持cuda10.1。下图是支持cuda10.1的系统要求。使用以下指令查询自己的显卡、gcc、Linux内核$ lspci | grep -i nvidia$ uname -m && cat / etc / * release$ gcc --version$ uname -r...
2020-10-06 14:40:18
9149
原创 初次使用Ubuntu
1、怎样查看自己使用的Ubuntu版本?以下三种命令都行:1. uname -a 2. lsb_release -a 3. cat/proc/version3、Ubuntu下查看NVIDIA驱动版本号sudo dpkg --list | grep nvidia-*怎么查看Ubuntu上的Cuda版本?方法一:nvcc -V方法二:cat/usr/local/cuda/version.txt...
2020-09-26 20:10:03
338
原创 cant find model en. It doesn’t seem to be a shortcut link...
错误1:OSError: [E050] Can’t find model ‘en’. It doesn’t seem to be a shortcut link, a Python package or a valid path to a data directory.解决办法:python -m spacy download en输入上面的安装命令之后,安装速度真的是感人,一直出现目标服务器拒绝连接的问题,那么怎么提高下载速度呢?第一种办法就是在网速极佳的时间段下载,第二种办法是去官网下载
2020-09-26 11:12:15
1255
1
转载 python的函数、类
1. 创建函数函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段。函数能提高应用的模块性,和代码的重复利用率。内建函数vs.自己创建函数你已经知道Python提供了许多内建函数,比如print()。但你也可以自己创建函数,这被叫做用户自定义函数。1.1 定义一个函数你可以定义一个由自己想要功能的函数,以下是简单的规则:函数代码块以 def 关键词开头,后接函数标识符名称和圆括号()。任何传入参数和自变量必须放在圆括号中间。圆括号之间可以用于定义参数。函数的第一行语句可以选择
2020-09-23 10:35:23
357
转载 Python的层级结构
什么是Python程序概念层级?python分为4层:表达式 --> 语句 --> 模块 -->包1. 表达式表达式是python程序中最小的构成单位。表达式最基本的功能就是创建和处理对象(可以是任意类型的)。name="王大锤" 程序做了两件事情:第一:在内存中开辟一块区域存储一个字符串对象"王大锤";把对象"王大锤"在内存中的唯一标识指向name。就可以通过name这个引用来操作"王大锤"对象了。2. 语句个人理解:表达式说的是内存中有个什么对象 ;语句就是
2020-09-23 10:11:05
3393
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅