快捷导航

叙述衡石数据全旅程之数据准备

[复制链接]
查看: 1|回复: 0
发表于 2024-3-7 09:23:19 | 显示全部楼层 |阅读模式
我也被支配过!!搞了借呗和花呗。我特么差点被压死。现在就剩花呗那点还完就好了。你真的会发现自己的钱慢慢的就没了。不敢和爸妈说,不敢和朋友说,自己一个人为了有口饭吃瞒着所有人去厂里打工887。那段时间真的活的很累。那么难的一段时间刚发了一点点工资还被个人借走了点钱。那人是和我一起厂里上班的。和我一样大。说是打工给男朋友买aj的。借的也不多。我就傻傻的借给她了。结果人家拍拍屁股直接跑了。本来就很难。更难了。那段时间天天都想哭。别轻易相信别人,别碰花呗借呗,真的还光钱的感觉太美好了。这辈子我都不要去碰这些东西了。太可怕了。

数据分析是不断探索数据背后的规律进而得出业务洞察的过程,在进行分析前分析师需先将原始数据转换为面向分析、有业务语义的数据。数据准备的产出既可应用于各种数据分析工作,也能作为数据集应用于各种场景化数据产品,具体来说数据准备将原始数据转化为:准确、一致、清晰,并且有一定业务含义的数据,是数据和业务之间的桥梁和纽带,也是一个不断迭代、改进、化的过程。企业级bi平台的具体问题可以到我们网站了解一下,也有业内领域专业的客服为您解答问题,为成功合作打下一个良好的开端!https://www.hengshi.com/


比较新行业报告显示,数据分析师超过60%的时间都花在数据准备中的:数据清洗和数据整理上,真正用来探索数据,获取业务洞察的时间反而有限,工作效率急需提高。





HENGSHISENSE数据准备


HENGSHISENSE基于湖仓一体的架构,将ETL的经典数仓加工范式改为ELT的更加敏捷的数据准备过程,结合HQL的语义层能力,将T的环节虚拟化现,得到更加敏捷的数据处理管道,其高性能且灵活的ELT工作流加之自身业务侧和技术侧的势,能让客户在数据准备上的工作变的更高效。





在HENGSHISENSE的协同式数据准备中,分为两大版块:数据集成和数据科学,下面将围绕两大板块进行详细解读。











数据集成当多源数据连接状态显示成功后,数据集成提供ELT这里会对不同来源的数据进行抽取、过滤、转换格式、添加计算列、关联、合并、聚合等处理,再输出到用户指定的数据源中,供后续探索分析用。











新建数据集成项目后,后台提供G、PSQL、AR、M四种数据源作为输出路径。











有本地文件、数据连接、数据集市种类型输出节点。











其中本地文件:支持上传、两种格式


数据连接:分为内置数据连接和用户数据连接两大类


数据集市:可将数据集的成果导出到输出源中,方便客户探索使用


整个项目按照:提取数据-加载前SQL-验证S-表操作-更新方法-加载后SQL的顺序执行,以上任意步骤失败会导致整个项目的作业失败并停止,以确保得到的数据精确、严谨。





数据集成界面的交互方式中的节点,支持灵活拖动、自由布局,让用户使用更方便、直观。


改版后:


节点定义统一放在左边,方便后续功能扩展


节点类型不同,颜色、图标也不同,用户不易混淆


画布支持自适应缩放





新增的批量同步功能可速地把大量业务表同步到HENGSHI数据湖。


支持设置各种场景下同步策略,包括:表提取方式、全量提取建表策略、字段变化处理策略、后续新增表的同步策略,可同时执行多个数据任务来完成数据同步工作,支持定时、时同步数据。








数据科学数据科学与数据集成在内为同级,其中自助式的“数据集成”面向业务人员,“数据科学”能满足客户执行SQL的需求。


下述为数据科学的工作流:1:管理员创建数据科学家用户,赋予数据管理角色2:数据科学家用户登陆,创建笔记3:设置笔记能用的连接,并授权使用4:数据科学家用户进入笔记,添加SQL类型的段落,并设置好执行的目标连接,然后写好SQL语句,运行段落5:数据科学家用户设定笔记的执行计划数据科学中有很多个“笔记”(N),每个“笔记”相互单独,每个“笔记”包含多个“段落”(P),每个“笔记”支持:增删改查


重命


全部执行全部停止


设置执行计划,由S统一调度


用户设定选择整个“笔记”为一个事务,还是一个“段落”作为一个事务


用户设定“笔记”可用的连接列表,当前用户可添加的连接必须是拥有RW权限的连接





笔记的状态为:创建、删除、编辑。











段落的状态为:新建、上传文件新建、设置、打开、删除。











运行环境设置的状态为:添加、授权、取消授权、删除、运行时设置。











执行的状态为:测试、提交、结果预览、日志、全部、计划。











任务管理的状态为:执行计划、执行队列。





数据准备作为大数据应用的基石,任何行业的数据分析都必须在数据准备这做足功夫,才能让数据模型、数据应用的价值得到更好体现,也是衡石持久攻坚的板块。
我的情况和up差不多但是比up好一些,我大概是去年7月买了一个电脑(当时老的笔记本已经坏了,但是还能用只不过会有问题),我就想重新买一个电脑吧,。既然买就买好一些的花了7200,做了一年的分期(还有两个月还清),当时工资比较低3000一个月,其实还信用卡还是有难度大后来而且花呗里面也欠了一些钱(因为工资低所以有些时候就要用花呗),所以当时是欠了一大笔钱后来换了工作工资变成6500一个月了现在信用卡基本上能还清每一期的金额,另外再还花呗再加上吃住基本上就是月光,再过两个月信用卡还清以后就拿还信用卡的钱还花呗这样基本上就开始存钱了而且花呗也就是3000多欠着用不了几期的,我想等我还清这些钱以后基本上不会再有重大消费了,至于氪金从来不存在,我玩cf好几年了氪金不超过500。我想存钱很简单就是提高工资满足我日常消费就好了我不会有那种重大消费的欲望我最多就是每天买一个瑞鑫而已,而且我还是一个人生活基本上还清信用卡和花呗以后工资里面就除掉吃住其余的就可以存下来(还清信用卡和花呗以后如果工资能提上去这个也花不了几个钱)。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号

本版积分规则

精彩推荐

让信用卡更简单

  • 反馈建议:麻烦到信用卡交流吧管理处反馈
  • 我的电话:不给不给就不给
  • 工作时间:周一到周五

关于我们

云服务支持

精彩文章,快速检索

关注我们

Copyright 用卡吧  Powered by©  技术支持:飛    ( 闽ICP备2021007264号-11 )