• 首页
  • 如何处理黑平台不出款
  • 黑平台怎么追回资金
  • 平台被黑不出款怎么办
  • 联系我们
  • 开通VIP发文章免审核

{{userData.name}}

个人中心
后台
{{item.count}}
{{textHint.loading}}
  • {{data.name}}({{data.count}}){{data.name}}
写文章
当前位置:首页-如何处理黑平台不出款-正文

单注异常提不了款 伴鱼DQC数据质量平台实践

专业出黑 专业出黑 如何处理黑平台不出款11个月前0011.84M0
基础架构数据团队

日常工作中,数据开发、数仓开发工程师开发上线完一个任务后并不是就可以高枕无忧了,时常会因为上游链路数据异常或者自身处理逻辑的 BUG 导致产出的数据结果不可信。而这个问题的发现可能会经历一个较长的周期(尤其是离线场景),往往是业务方通过上层数据报表发现数据异常后 push 数据方去定位问题(对于一个较冷的报表,这个周期可能会更长)。同时,由于数据加工链路较长需要借助数据的血缘关系逐个任务排查,也会导致问题的定位难度增大,严重影响开发人员的工作效率。更有甚者,如果数据问题没有被及时发现,可能导致业务方作出错误的决策。此类问题可统一归属为大数据领域数据质量的问题。

本文将向大家介绍伴鱼基础架构数据团队在应对该类问题时推出的平台化产品-数据质量中心(Data , DQC)的设计与实现。

调研

业内关于数据质量平台化的产品介绍不多,我们主要对两个开源产品和一个云平台产品进行了调研,下面将一一介绍。

是 eBay 开源的一款基于 和 Spark 的数据质量服务平台。其架构图如下:

架构图从 High Level 层面清晰地展示了数据质量平台的三个核心流程:

同时,平台对数据质检规则进行了分类(这也是目前业内普遍认可的数据质量的六大标准):

目前该开源项目仅在 类的规则上进行了实现。

是一个完全闭环的平台化产品。其质检任务的执行依赖于内置定时调度器的调度,调度执行时间由用户在 UI 上设定。任务将通过 Livy 组件提交至配置的 Spark 集群。这也就意味着质检的实时性难以保障,我们无法对产出异常数据的任务进行强行阻断,二者不是在同一个调度平台被调度,时序上也不能保持串行。

是微众银行开源的一款数据质量管理系统。同样,它提供了一整套统一的流程来定义和检测数据集的质量并及时报告问题。从整个流程上看我们依然可以用 、 和 描述。它是基于其开源的另一款组件 进行计算任务的代理分发,底层依赖 Spark 引擎,同时可以与其开源的 任务开发平台无缝衔接,也就实现了在任务执行的工作流中嵌入质检任务,满足质检时效性的要求。可见, 需要借助微众银行开源的一系列产品才能达到满意的效果。

数据质量

是阿里云上提供的一站式大数据工场,其中就包括了数据质量在内的产品解决方案。同样,它的实现依赖于阿里云上其他产品组件的支持。不过不得不说 数据质量部分的使用介绍从产品形态上给了我们很大的帮助,对于我们的产品设计非常具有指导性的作用。

设计目标

经过一番调研,我们确定了 DQC 的设计目标,主要包括以下几点:

系统设计背景补充

伴鱼离线调度开发平台是基于 (下文简称 DS)实现的。它是一个分布式去中心化,易扩展的可视化 DAG 调度系统,支持包括 Shell、、Spark、Flink 等多种类型的 Task 任务,并具有很好的扩展性。架构如下图所示:

节点负责任务的监听和调度, 节点则负责任务的执行。值得注意的是,每一个需要被调度的任务必然需要设置一个调度时间的表达式(cron 表达式),由 定时为任务生成待执行的 DAG ,有且仅有一个 节点获得执行权,掌管该 DAG 各任务节点的调度执行。

整体架构

以下是平台整体的架构图:

由以下几部分组成:

下文主要阐述我们在各模块设计上的一些思考和权衡。

规则表述标准与规则

前文在调研部分提及了业内普遍认可的数据质量的六大标准。那么问题来了:

可以将这些问题统一归类为:平台在规则设定上是否需要和业界数据质量标准所抽象出来的概念进行绑定。很遗憾我们并没有找到有关数据质量标准更加细化和指导性的描述,事实上作为一个开发人员这些概念对于我来说是比较费解的,而更贴近程序员视角的方式是「show me the code」,因此我们决定将这一层概念弱化。未来更深入的实践过程后再做更细化的思考。

标量化

接下来我们着重讨论下另一个问题:

其实当我们跳脱出前文所描述的一切背景和概念,仔细思考下数据质检的过程,会发现本质上就是通过一次真实的任务执行产出结果,然后对比输出结果与期望是否满足,以验证任务逻辑的正确性。这个过程可形象得和 Unit 进行类比,只不过 Unit 是通过模拟数据构造的一次代码逻辑的执行。另外数据任务执行产生的结果是一张二维结构的 Hive 表,需要进行加工方能获取到想要的统计结果,这也是两者的区别之一。

顺着这个思路,我们可以利用 Unit 的概念从以下三方面继续深入:

Value

数据任务执行产出的结果是一张 Hive 表,我们需要对这张 Hive 表的数据进行加工、提取以获得需要的 Value。涉及到对 Hive 表的加工,必然想到是以 SQL 的方式来实现,通过 Query 和 一系列 操作拿到结果,此结果的结构又可分为以下三类:

显然单行且单列的标量是我们期望得到的,因为它更易于结果的比较(事实上就目前我们所能想到的规则,都可以通过 SQL 方式提取为一个标量结果)。因此,在规则设计中,需要规则创建者输入一段用于结果提取的 SQL,该段 SQL 的执行结果需要为一个标量。

Value

既然 Value 是一个标量,那么 Value 同样也是一个标量,需要规则创建者在平台输入。

上述标量的类型决定了断言的比较方式。目前我们只支持了数值型标量的比较方式,包含「大于」、「等于」及「小于」三种比较算子。如出现其他类型标量,需要扩充比较的方式。

以上三要素即可完整的描述规则想要表达的核心逻辑。如我们想要表述「字段为空异常」的规则(潜在含义:字段为空的行数大于 0 时判定异常),就可以通过以下设定满足:

规则管理规则模板

规则模板是为了规则复用抽象出的一个概念,模板中包含规则的 SQL 定义、规则的比较方式、参数定义(注:SQL 中包含一些占位符,这些占位符将以参数的形式被定义,在规则实体定义时需要用户明确具体含义)以及其他的一些元信息。下图为「字段空值的行数」模板的示例:

规则实体

规则实体是基于规则模板构建的,是规则的具象表达。在规则实体中将明确规则的 Value、比较方式中具体的比较算子、参数的含义以及其他的一些元信息。基于同一个规则模板,可以构造多个规则实体。下图为「某表 唯一性校验」规则的示例:

值得一提的是,规则可能不仅仅只是针对单表的校验,对于多表的情况我们这套规则模板同样是适用的,只要我们可以将逻辑使用 SQL 表达。

规则绑定

在 DS 的前端交互上支持为任务直接绑定校验规则,规则列表通过 API 从 DQC 获取,这种方式在用户的使用体验上存在一定的割裂(规则创建和绑定在两个平台完成)。同时,在 DQC 的前端亦可以直接设置关联调度,为已有任务绑定质检规则,任务列表通过 API 从 DS 获取。同一个任务可绑定多个质检规则,这些信息将存储至 DS 的 DAG 元信息中。那么这里需要考虑几个问题:

主要有两种方式:

我们选择了后者,ID List 方式可以使对 DS 的侵入降到最低。

规则执行强规则和弱规则

规则的强弱性质由用户为任务绑定规则时设定,此性质决定了规则执行的方式。

强规则

和当前所执行的任务节点同步执行,一旦规则检测失败整个任务节点将置为执行失败的状态,后续任务节点的执行会被阻断。对应 DS 中的执行过程表述如下:

弱规则

和当前所执行的任务节点异步执行,规则检测结果对于原有的任务执行状态无影响,从而也就不能阻断后续任务的执行。对应 DS 中的执行过程表述如下:

可以看出在强弱规则的执行方式上,对 DS 调度部分的代码有一定的侵入,但这个改动不大,成本是可以接受的。

DQC Task & DQC SDK

上文提及到一个 Job Task 绑定的规则(可能有多个)将被转换为一个 DQC Task 被 DS 调度执行,接下来我们就讨论下 DQC Task 的实现细节以及由此引出的 DQC SDK 的设计和实现。

DQC Task 继承自 DS 中的抽象类 ,只需要实现抽象方法 (任务执行的具体实现)即可。那么对于我们的质检任务,实际上执行逻辑可以拆分成以下几步:

最核心的步骤为 Query 的执行。Query 的实现方式又可分为两种:

Spark 实现

SQL 实现

我们选择了后者,这种方式最易实现,离线场景这部分的计算耗时也可以接受。同时由于一个 DQC Task 包含多条规则,在拼接 SQL 时将同表的规则聚合以减少 IO 次数。不同的 SQL 交由不同的线程并行执行。

上述执行逻辑其实是一个完整且闭环的功能模块,因此我们想到将其作为一个单独的 SDK 对外提供,并以 Jar 包的形式被 DS 依赖,后续即便是更换调度引擎,这部分的逻辑可直接迁移使用(当然概率很低)。那么 DS 中 DQC Task 的 逻辑也就变得异常简单,直接以 Shell 形式调用 SDK ,进一步降低对 DS 代码的侵入。

执行结果

单条规则的质检结果将在平台上直接展现,目前我们还未对任务级的规则进行聚合汇总,这是接下来需要完善的。对于质检失败的任务将向报警接收人发送报警。

实践中的问题

平台解决了规则创建、规则执行的问题,而在实践过程中,对用户而言更关心的问题是:

这些是很难通过平台自动实现的,因为平台理解不了业务的信息,平台能做的只能是通过质量检测报告给与用户反馈。因此这个事情需要具体的开发人员对核心场景进行梳理,在充分理解业务场景后根据实际情况进行设定。话又说回来,平台只是工具,每一个数据开发人员应当提升保证数据质量的意识,这又涉及到组织内规范落地的问题了。

未来工作

数据质量管理是一个长期的过程,未来在平台化方向我们还有几个关键的部分有待继续推进:

相关文章

  • 网上赢钱被黑账号违规不给出款怎么办 黑平台不给提款怎么办 在网上的平台被黑钱无法提款-建议用这个办法

    网上赢钱被黑账号违规不给出款怎么办 黑平台不给提款怎么办 在网上的平台被黑钱无法提款-建议用这个办法

    1、随笔4.网上碰到黑网要注意的问题很多,特别是我们需要注意防止自己的账号网络有一些虚假的网站,类型还是不少的,特别是最近出现被黑的情况,还是很…
    专业出黑 专业出黑 如何处理黑平台不出款1年前0014.10M0
  • 黑网被黑不给提款怎么办 平台不给提款取款通道维护怎么办取款不了的原因

    黑网被黑不给提款怎么办 平台不给提款取款通道维护怎么办取款不了的原因

    1、核心阅读平台通道维护中一直提现失败,我们可以通过一些技术来达到黑平台让你出款的目的,其实就是利用黑网站觉得你来能带来更多的利益,也就是他们目…
    专业出黑 专业出黑 如何处理黑平台不出款1年前0016.17M0
  • 提款被黑 网上赢了钱不给提款怎么办 网上网站在提款一直审核失败该怎么办?【网站提款失败退回怎么办】

    提款被黑 网上赢了钱不给提款怎么办 网上网站在提款一直审核失败该怎么办?【网站提款失败退回怎么办】

    网上赢钱不给提款怎么办?1、首先检查您网上网站在提款一直审核失败该怎么办?的账户是否可以正常登录相关网站。如果能登录网上网站在提款一直审核失败该…
    专业出黑 专业出黑 如何处理黑平台不出款9个月前0019.63M0
  • 出款通道维护不能出款 碰到平台出现提示通道维护取款失败--分析解决办法

    出款通道维护不能出款 碰到平台出现提示通道维护取款失败--分析解决办法

    1、内容一句话点评黑平台黑钱怎么要回来伪装:通过与客服交流的谈话技巧和忽悠能力装傻能力了,就算你知道他们是黑网准备黑你钱你也别捅破。…
    专业出黑 专业出黑 如何处理黑平台不出款10个月前0014.10M0
  • 平台的钱还不上怎么办 网贷逾期暂时还不上怎么办

    平台的钱还不上怎么办 网贷逾期暂时还不上怎么办

    网贷逾期暂时还不上怎么办1.好好沟通,不要拒绝接电话。有些人会在逾期不接电话甚至黑掉电话,因为在我们的天性中是不安或者害怕的,但这其实是一种错误…
    专业出黑 专业出黑 如何处理黑平台不出款1年前0016.47M0
  • 网投被黑平台不给提款怎么办 平台退场、炒家被套牢、提现难频现,数字藏品行业迎寒冬?

    网投被黑平台不给提款怎么办 平台退场、炒家被套牢、提现难频现,数字藏品行业迎寒冬?

    2022年8月16日,腾讯幻核发布公告称,即日起将停止数字藏品发行,同时所有通过其平台购买过数字藏品的用户可自行选择继续持有或发起退款申请。…
    专业出黑 专业出黑 如何处理黑平台不出款1年前0016.27M0
  • 被平台黑了不能出款怎么办? 起诉协商还款律师说是打款到另一张银行卡,律师建议:协商还款时,如何正确转账至指定银行卡

    被平台黑了不能出款怎么办? 起诉协商还款律师说是打款到另一张银行卡,律师建议:协商还款时,如何正确转账至指定银行卡

    欠网贷会查到另一张银行卡吗欠网贷会查到另一张银行卡吗?这个问题涉及到法律行业中的原因信息共享、数据保护和法律责任等方面。根据目前的调解法律规定和…
    专业出黑 专业出黑 如何处理黑平台不出款0年前0016.77M0
  • 平台网站维护不给提款 在网上碰到系统风控审核注单数据更新未同步提不了款,成功解决技巧

    平台网站维护不给提款 在网上碰到系统风控审核注单数据更新未同步提不了款,成功解决技巧

    在黑网营前被黑的情况出现了不要和客服理论,注意是盈利很多,出款要很多的时候,一些要记住不要跟客服吵,如果你一直纠缠可能会直接到账被封号的,注意是…
    专业出黑 专业出黑 如何处理黑平台不出款1年前0014.40M0
  • 网站提款一直提不出来怎么办 2019年也是夏天 我又复赌了

    网站提款一直提不出来怎么办 2019年也是夏天 我又复赌了

    赌徒自诉|如果在2018年的那个夏天我没有点开那个网站一切会不会都不一样了…我今年22岁,2000年生人,到8月就23了,沾赌是从18年的那…
    专业出黑 专业出黑 如何处理黑平台不出款1年前0017.36M0
  • 赢钱被黑不能提款 平析 | 冰墨爆冷、强队输球的背后,隐藏着最黑暗的全球**操纵大网!

    赢钱被黑不能提款 平析 | 冰墨爆冷、强队输球的背后,隐藏着最黑暗的全球**操纵大网!

    **这玩意,赔率越高,你就输得越狠。…
    专业出黑 专业出黑 如何处理黑平台不出款9个月前0015.39M0
  • 网上平台审核不给提款 在平台上提款维护审核不给还能拿回钱吗

    网上平台审核不给提款 在平台上提款维护审核不给还能拿回钱吗

    1、狮评你出现了网上平台不给出款了,自己也没办法的时候,这个时候我们有几种的解决办法网上平台不给出款种解决的办法就是找平台客服沟通,让平台客户给…
    专业出黑 专业出黑 如何处理黑平台不出款1年前0014.30M0
  • 取款取不出 ATM取款机“吐”不出50元纸币?

    取款取不出 ATM取款机“吐”不出50元纸币?

    ATM取款机“吐”不出50元纸币?2004年02月16日11:17桂龙新闻网-柳州日报近日,自桂林某高校来柳的王同学向本报反映…
    专业出黑 专业出黑 如何处理黑平台不出款11个月前0014.10M0

最新文章

  • 平台系统维护提不了款怎么办 曝某借贷平台涉高利贷陷阱用户权益难维护
  • 在线ai绘画生成软件 4款国内免费ai绘画软件,无限制无审核,巨好玩! - 哔哩哔哩
  • 利用chatgpt进行高考志愿填报 选择计算机专业,后悔莫及?大学老师:高考志愿填报慎选!
  • 在线ai绘画生成软件 7款免费的ai绘画生成器推荐,ai自动生成绘画 - 哔哩哔哩
  • 互联网流量怎么挣钱 流量变现的又一暴利项目,新手可做每天赚500
  • 在线ai绘画生成软件 收藏这18款免费ai绘画软件,轻松掌握ai绘画在线生成图片! - 哔哩哔哩
  • 网上被黑不给提怎么解决 在网上的平台说数据延时提现不了
  • 阿里版chatgpt怎么申请 中国版ChatGPT会是谁?ChatGPT本尊回应了
  • 网上被黑不给提怎么解决 网上提款审核失败,网上被黑提款风控审核失败不给提款怎么解决?可以这样操作
  • 人工智能chatgpt4.0能打游戏吗 超星尔雅《人工智能》章节测验答案
  • 被平台黑了不能取款怎么办 网上被黑平台不让提现困扰您?正确解决方法来帮您一臂之力
  • 如何让chatgpt写完完整代码 用DeepSeek全自动写代码
  • 被平台黑了不能取款怎么办 网上遇到被黑了不能提款怎么办(以下几点教你解决)
  • 如何让chatgpt对文档内容进行整理 原来 ChatGPT 可以这样用:根据个人需求订做一周健康菜单
  • 如何让chatgpt写完完整代码 ChatGPT史诗级大更新!Canvas来了,可辅助完成编程、写作
  • 赢钱被黑网站一直不给提款怎么解决 “警醒”streamingapp是新型诈骗软件,违规操作错为不给提现怎么办
  • 如何让chatgpt对文档内容进行整理 ChatGPT“成人模式”:AI新世界的潘多拉魔盒?
  • 人民币 特别提款权 人民币SDR权重上调至12.28%,有什么作用?专家解读
  • 发货软件哪个好 发货单软件免费版

没有相关内容

Copyright © 2022-至今 被平台黑了取不了款怎么出黑•现在最火的免费发帖推广平台网站 陕ICP备2023010157号
42 次查询在 1.309 秒, 使用 41.39MB 内存