又是一年季。今年,ApacheDolphinScheduler同样参与到了活动中来,希望有更多学生群体关注到ApacheDolphinScheduler,并踊跃参与项目共建拿奖金!
No.1活动介绍
开源之夏是由“开源软件供应链点亮计划”发起并长期支持的一项暑期开源活动,由中国科学院软件研究所与openEuler社区共同举办,旨在鼓励在校学生积极参与开源软件的开发维护,促进优秀开源软件社区的蓬勃发展,培养和发掘更多优秀的开发者。
学生可自主选择感兴趣的项目进行申请,并在中选后获得社区导师亲自指导。根据项目的难易程度和完成情况,参与者还将获取开源之夏活动奖金和结项证书。
开源之夏活动官网:https://summer.iscas.ac.cn/
No.2活动日程
No.3项目介绍
ApacheDolphinScheduler是一个云原生易扩展的可视化DAG工作流任务调度系统。致力于解决数据处理流程中复杂的任务依赖关系,使各种任务类型(Spark/Flink/MR/Shell/Python/SQL等)在工作流编排中开箱即用。
No.4奖金设置
进阶:奖金人民币12000元
优化类的任务,例如提高性能,降低资源占有
基础:奖金人民币8000元
功能类的任务,例如为本社区开源项目增加一个或若干个重要特性等
No.5八大课题
本次活动,ApacheDolphinScheduler开源社区共设有8个项目课题具体如下,欢迎参与:
01为DolphinSchedulerPythonAPI添加资源文件
多链NFT市场Hyperspace已在Avalanche上线:9月7日消息,多链 NFT 市场和 Launchpad 平台 Hyperspace 已在 Avalanche 上线。Hyperspace 计划为 Avalanche 上的 NFT 拥有者和收藏家带来创新功能和增强的 UI/UX,包括实时交易体验、集合竞标、钱包分析、活动监控、跨链交换等。此外,Hyperspace 还将通过其 Launchpad 产品在 Avalanche 上推出 Dokyo 系列 NFT。[2023/9/7 13:23:48]
222290294
进阶/Advanced
Python
目前,DolphinSchedulerPythonAPI只能传递字符串格式传递任务的参数,例如我们的tutorial
dolphinscheduler/dolphinscheduler-python/pydolphinscheduler/src/pydolphinscheduler/examples/tutorial.py
我们只将一个字符串传递给shell任务类型。但通常来说,用户希望具体的执行代码储存在其他系统中,例如将具体文件存储在本地文件系统、GitHub、GitLab、AmazonS3、阿里云OSS等。也许我们可以添加语法糖让用户更加简单的操作外部文件
任务task_parent将从URLhttps://github.com/apache/dolphinscheduler/blob/dev/script/install.sh加载文件内容并将其传递给参数command,它使我们的DAG文件更容易和可维护
实现Resource的插件化
实现具体的插件Resource包括但不限于本地文件系统,GitHub,GitLab,AmazonS3,阿里云OSS
PythonAPI的通过测试覆盖率,当前阈值为90%
文档,包括开发和使用
熟悉python,包括decorator、io、network、unittest、document
稳定币脱钩风险定价协议Y2KFinance上线V2,存款资产支持WETH或ARB:6月2日消息,基于Arbitrum的稳定币脱钩风险定价协议Y2K Finance宣布正式上线V2版本,允许用户存入抵押品至对冲金库并获得y2ktokens(金库代币)作为回报来对冲资产脱钩,支持的市场包括MAI、USDD和USDC,存款资产(抵押品)支持WETH或ARB。Y2K Finance是为挂钩衍生品设计的一套结构性产品,使市场参与者能够稳健地对冲或推测偏离其公允隐含市场价值的特定挂钩资产(或一篮子挂钩资产)的风险。其中,Earthquake是一款为稳定币脱钩提供对冲工具的产品。[2023/6/2 11:53:47]
https://github.com/apache/dolphinscheduler
https://github.com/apache/dolphinscheduler-website
钟嘉杰
联系方式:zhongjiajie955@gmail.com
02资源中心优化
222290456
进阶/Advanced
Java、Shell
重构Dolphinscheduler资源中心的读写逻辑
目前资源中心读写HDFS/S3/本地目录通过在数据库表中t_ds_resources记录文件/文件夹目录来实现文件记录,但是在用户初始化DS或者用户在DS的外部修改了第三方存储的内容的时候DS无法进行实时同步,希望能够与第三方存储的内容保证实时同步
DS不存储资源中心中文件的路径,对于资源中心的读写全都通过调用第三方API实现,只保存任务实例依赖到的内容路径于数据库用于文件删除校验。
实现现有的资源中心的所有功能,其中包括文件/文件夹增删改查,任务实例调用资源中心
后端API文档
了解Linux系统,对Linux文件管理有一定的熟悉
了解HDFS/S3组件,能够较快速的根据官方文档学习API的使用
比特币全网未确认交易数量为186002笔:金色财经报道,据BTC.com数据显示,目前比特币全网未确认交易数量为186002笔,全网算力为329.13 EH/s,24小时交易速率为5.16交易/s,目前全网难度为48.71 T,预测下次难度下调2.71%至47.39 T,距离调整还剩5天12小时。[2023/4/30 14:35:00]
熟悉Java语言
https://github.com/apache/dolphinscheduler
https://github.com/apache/dolphinscheduler-website
向梓豪
联系方式:zihaoxiang@apache.org
03master/worker/api模块日志优化
222290457
进阶/Advanced
Java
由于DS日志不方便真实定位问题,需要将打印日志进行规范及优化
整理出DS打印日志规范指导文档,并提交到文档库
将master/worker/api模块按照规范文档进行落地并提交到开发分支
熟悉Java语言
https://github.com/apache/dolphinscheduler
https://github.com/apache/dolphinscheduler-website
进勇
联系方式:jiny.li@foxmail.com
04自动收集、保存作业提交的Yarn作业的applicationid
222290458
进阶/Advanced
Java
DolphinScheduler支持各种各样的作业,比如Python、Shell等,其中一个很基础的功能就是收集这些作业创建的YarnJob的applicationid。现在的实现方式是用一个正则表达式从作业的日志中解析,但这并不是一个完美的实现方式,本课题的任务就是用一种新的方式去自动收集、报错YarnJob的applicationid信息,当然了,必须对用户透明,即对用户创建的作业无侵入。
尼日利亚联合银行因违反该国加密货币法规被央行处以2亿奈拉罚款:金色财经报道,尼日利亚央行(CBN)对尼日利亚联合银行(UBN)处以2亿奈拉(约合43.3万美元)罚款,原因是该银行违反了该国对加密货币交易的规定。UBN在周三公布的截至2022年12月31日的年度合并和单独财务报表中披露了这笔罚款。
此前央行曾警告商业银行,不要通过允许账户接收和发送与数字货币相关的资金来进行加密货币交易。据悉,由Godwin Emefiele领导的CBN对加密货币持反对立场,最终尼日利亚于2021年2月5日禁止加密货币交易。(Ripples Nigeria)[2023/4/20 14:14:35]
自动收集、报错YarnJob的applicationid信息
必须对用户透明,即对用户创建的作业无侵入
熟悉Java,Yarn,Hive,SparkSQL,AOP
https://github.com/apache/dolphinscheduler
https://github.com/apache/dolphinscheduler-website
gabrywu
联系方式:gabrywu@apache.org
05为DolphinScheduler添加服务初始化的工作流demo
222290459
进阶/Advanced
Java、Shell
用户在启动DolphinScheduler服务后,可以使用demo-tool程序预置工作流demo,包括但不限于简单的shell任务、逻辑组件任务、参数传递等功能,引导用户更方便地使用DolphinScheduler。
预置工作流demo的tool程序
服务启动脚本添加init模式
工作流demo包括但不限于shell任务、逻辑组件任务、参数传递等
熟悉Java、Shell
https://github.com/apache/dolphinscheduler
美联储FOMC声明:需要继续加息,直到利率达到足够限制性的水平:11月3日消息,美联储FOMC声明,就业增长强劲,失业率保持在低位。需要继续加息,直到利率达到足够限制性的水平。将在(制定政策时)考虑累积紧缩和滞后效应。[2022/11/3 12:11:14]
https://github.com/apache/dolphinscheduler-website
蔡顺峰
联系方式:caishunfeng2021@gmail.com
06为DolphinScheduler添加Java任务类型
222290460
进阶/Advanced
Java、Shell、Vue、TypeScript
提供Java类型的调度任务,包括Jar和自定义Java代码两种方式,通过WEBUI定义Java运行时所需要的Resources、Libs资源文件和JVM参数,覆盖定时任务调用Java程序场景并提升用户方便配置。
可执行的Java类型任务插件
Java类型插件支持Jar方式,提供Resources、Libs资源文件和JVM参数的动态参数输入
Java类型插件支持WebUI自定义Java代码方式,提供Java类即时编译,执行
熟悉Shell、Java、SPI、Javacompiler、VUE3、TypeScript
https://github.com/apache/dolphinscheduler
https://github.com/apache/dolphinscheduler-website
Kerwin
联系方式:zhuangchong6@163.com
07支持测试任务
222290461
进阶/Advanced
Java、Vue
目前新增/修改的工作流在上线前很难验证工作流配置是否正确,只能通过在线上环境执行来验证,所以有必要支持测试环境执行任务。
数据源中心支持配置测试环境源,线上环境源可绑定一个测试环境源。任务执行及工作流执行支持“是否测试”选项,选择测试时,Worker节点在任务执行前,自动替换线上环境源为绑定的测试环境源,再配合Worker分组实现线上、测试环境的隔离,最终达到支持测试任务的目标。
数据源配置页面增加线上、测试选项,支持绑定测试源
工作流执行页面、任务执行页面新增线上、测试选项
Master节点、Worker节点解析执行环境标识,替换数据源为测试数据源
工作流实例、任务实例页面增加执行环境标识
熟悉Java、Spring、VUE3
https://github.com/apache/dolphinscheduler
https://github.com/apache/dolphinscheduler-website
温合民
联系方式:whm_777@163.com
08为DolphinScheduler的项目和资源中心增加读写权限的授权管理
222290462
基础/Basic
Java、Vue、TypeScript
当前DolphinScheduler对于权限的管控相对比较简单,希望在进行项目和资源中心授权时增加操作权限管控来进行读写权限的分离。
针对单个项目的全部内容进行读写权限区分,对单个用户针对单个项目授权只读或者读写权限
针对资源中心的全部内容进行读写权限区分,基于当前资源中心的授权内容区分出只读或者读写权限
进行授权时前端页面增加只读和读写的授权操作
熟悉Java、Spring、Vue3、TypeScript
https://github.com/apache/dolphinscheduler
https://github.com/apache/dolphinscheduler-website
孙朝和
联系方式:sunzhaohe0825@gmail.com
No.6申请参与项目
01申请资格
本活动面向年满18周岁在校学生。
暑期即将毕业的学生,只要在申请时学生证处在有效期内,就可以提交申请。
海外学生可提供录取通知书/学生卡/在读证明证明学生身份。
02参与流程
03申请建议
欢迎主动向导师发送邮件进行沟通,附上自己的方案和简历,更加了解你~
认真了解社区项目文档,与导师充分沟通。
欢迎加入交流群交流
参与贡献
随着国内开源的迅猛崛起,ApacheDolphinScheduler社区迎来蓬勃发展,为了做更好用、易用的调度,真诚欢迎热爱开源的伙伴加入到开源社区中来,为中国开源崛起献上一份自己的力量,让本土开源走向全球。
参与DolphinScheduler社区有非常多的参与贡献的方式,包括:
贡献第一个PR(文档、代码)我们也希望是简单的,第一个PR用于熟悉提交的流程和社区协作以及感受社区的友好度。
社区汇总了以下适合新手的问题列表:https://github.com/apache/dolphinscheduler/issues/5689
非新手问题列表:https://github.com/apache/dolphinscheduler/issues?q=is%3Aopen+is%3Aissue+label%3A%22volunteer+wanted%22
如何参与贡献链接:https://dolphinscheduler.apache.org/zh-cn/docs/development/contribute.html
来吧,DolphinScheduler开源社区需要您的参与,为中国开源崛起添砖加瓦吧,哪怕只是小小的一块瓦,汇聚起来的力量也是巨大的。
参与开源可以近距离与各路高手切磋,迅速提升自己的技能,如果您想参与贡献,我们有个贡献者种子孵化群,可以添加社区小助手微信(Leonard-ds),手把手教会您(贡献者不分水平高低,有问必答,关键是有一颗愿意贡献的心)。
添加小助手微信时请说明想参与贡献。
来吧,开源社区非常期待您的参与。
活动推荐
当数据资源成为生产发展乃至于生存过程中必不可少的要素,企业该如何通过数据集成帮助企业数据服务全生命周期落地呢?5月14日,数据集成框架ApacheSeaTunnel(Incubating)将邀请一站式数据集成平台ApacheInLong(Incubating)的技术专家与开源贡献者们,一同来到直播间,与大家畅谈使用ApacheSeaTunnel(Incubating)与ApacheInLong(Incubating)后的实践经历与心得体会。
直播链接:https://www.slidestalk.com/m/777
本文转自; 美国肉价创新高。海外网5月29日电据美国有线电视新闻网28日报道,全美将迎来烤肉旺季,然而肉价因通货膨胀创新高,美国民众若想节省开销,可能需要寻找烤肉以外的替代品.
1900/1/1 0:00:00马斯克身家暴跌,3天蒸发210亿美元,上热搜了,大家都知道马斯克,世界首富呀,之前因为世界首富上热搜,现在呢又因为身价暴跌,上了热搜,三天210亿美元,合计上千亿元人民币.
1900/1/1 0:00:00美股收高能源领涨 周二美股三大股指震荡收高,市场继续评估通胀和经济增长前景。美国财长耶伦在周二的参议院听证会上表示,美国通货膨胀居高不下,预计未来一段时间仍将保持在高位.
1900/1/1 0:00:00随着5月份美联储加息50BP落地,美元指数不断走强,再度突破100元大关,5月6日美元指数一度站上104.
1900/1/1 0:00:00你听厌了关于加密货币的说法了吗?别担心,我们也是。但重要的是,鉴于对其解放力量的无休止的夸大宣称——以及所涉及的巨额资金,我们有必要对加密货币到底做了什么和没有做什么进行澄清.
1900/1/1 0:00:00记者|司林威 经历了一场全球瞩目的“UST”暴雷事件后,加密货币深陷熊市之中。5月24日,行情数据显示,比特币现报29399美元一枚,多日位于3万美元之下,正试图收复关键点位.
1900/1/1 0:00:00