smartpip实现按ID增量抽取


在数据抽取过程中, 如何通过目标数据库最大ID或时间等条件进行抽取, 这样可以将数据同步的粒度做得更细

标准方法

在datax的数据同步设定中加入

##incColumn = 增量字段
##incDB = 目标查询DB[默认为starrocks]

数据集方式

  • 首先我们需在smartchart的数据集开发中新建一个查询sql 例如maxid, event_day对应的参数名
select 
 max(id) as maxid, max(event_day) as event_day 
from targettablename
  • 在DAG开发中将数据集ID当做参数传递即可,假设数据集ID为

Read more

smartpip实现自定义邮件


你可能需要自定义邮件内容, 甚至可能需要动态获取数据进行发送

固定内容发送

msg = ['报表刷新成功', '<h1>刷新成功!!</h1>']
maillist = 'xxx@smartchart.cn'

#send_mail reportmail msg maillist

动态获取数据发送

maillist = 'xxx@smartchart.cn,abc@xxx.cn'
def fun_msg():
    result = get_dataset(123)['data']
  

Read more

JS数组处理


Smartchart开发中, 最常需使用的就是对数组进行处理

JavaScript的Array可以包含任意数据类型,并通过索引来访问每个元素。 要取得Array的长度,直接访问length属性:

var arr = [1, 2, 3.14, 'Hello', null, true];
arr.length; // 6

请注意,直接给Array的length赋一个新的值会导致Array大小的变化:

var arr = [1, 2, 3];
arr.length; // 3
arr.length = 6;
arr; // arr变为[1, 2, 3, undefined, undefined, u

Read more

smartpip实现循环抽取任务


比如数据库中存在一些表, 这些表名后缀是按天命名的, 现在需要自动抽取汇总到同一个表中, 这样就需要用到循环抽取 smartpip中已有datax组件, 但只能进行单一表格抽取, 不能增加逻辑 所以我们需要使用到smartpip的diy组件功能 首先我们需要新一个datax抽取任务,在这个任务中我们传递参数ZYM, 比如:

#datax job1  ZYM

之后再新一建一个diy任务, 实现循环抽取:

ZYM = '202001'
def fun_job2():
    job = os.path.join(ETL_FILE_PATH , '项目名/job1.sql')
    report

Read more

StarRocks FE开发


Setup StarRocks FE development environment on IDEA

This tutorial is based on macOS and has been tested on Apple Chip(M1, M2). Even if you are not using macOS, you can also refer to this tutorial.

Requirements

Thrift 0.13

If you installed Thrift directly with brew, you will find that there is no vers

Read more

luckysheet相关配置


luckysheet.create({
        container: "luckysheet", // 设定DOM容器的id
        title: "Luckysheet Demo", // 设定表格名称
        lang: "zh", // 设定表格语言
        plugins: ["chart"],
        data: [
          {
            name: "", //工作表名称
            color: "#eee333", //工作表(工作表名称底部边框线)颜色
            index: 0, /

Read more

浅谈数据治理


数据治理是个长期过程, 要想完全治理好, 业务系统要重构, 企业承受不了. 所以真正能落地的就是边用边治理,不用起来也就不知道问题在那. 让数据可视了, 数据就会说话, 就知道数据在那出了问题.

数据治理分两个种方式, 一种是集中后在数据中台进行治理, 一种是在业务系统治理好. 最理想的方式是在业务系统治理. 但是由于企业的业务系统一般不是自已开发的, 供应商配合也差, 有的可能还是SAAS的,所以在数据应用前期大部分是在中台治理, 然后反哺业务系统进行治理

现代企业在做信息化的同时一定要考虑数据化的需求, 也就是最好同步进行, 而不是说一定要先有信息化才有数字化

如果数据不拉通在一起看就比

Read more

常见html组件


常见html组件
类型 标签 说明 效果
文字 h1..h6 <h4>我是中号字体</h4>

我是中号字体

文字 br 换行
图片 img <img src="smiley-2.gif" alt="Smiley face" width="42" height="42">
嵌入 iframe <iframe src="http://www.smartchart.cn"></iframe>
链接 a <a href="http://www.smartchart.cn" target="_blank"

Read more