​​kettle(实现增量更新-插入&更新)!

​​kettle(实现增量更新-插入&更新)!

由来:需要将一个系统的数据(MySQL)抽取到另一个系统(Oracle),使用ETL方式。随着数据量的增加,全量同步数据不可行,所以得做增量更新。业务数据表有主键,除了新增外,以前同步的数据非主键信息可能会发生更改。

1.看了下网上的思路,有一种是这样的(A代表表名):一句话概括-通过主键对比找到新增行-同步数据。

  ①select max(id) from mysql.A;===>>>找出MySQL中的最大ID;

  ②select * from oralce.A where a.id > ?;===>>>?代表①的max(id),找出oracle中比MySQL.max(id)大的ID;

  ③insert into mysql.A value = ②;===>>>将②中数据插入mysql;

006fRELkly4gpltyiar0vj30d604pdft

  第一步没什么滑头,第二步如下:

006fRELkly4gpltyiav11j30lw0egq3v

  第三步如下:

006fRELkly4gpltyi9mctj30sj0chabi

  *上述方法没有问题,但是在初始化的时候行不通,原因是步骤①-mysql.A中没数据时,即max(id)=null,导致带入第 ②步的and条件的id > null ,即varchar > null,数据不会写到MySQL,当MySQL中有一条符合条件的ID时,是可行的。

2.在转换中新增的“插入/更新”时其实已经包含了两个动作-插入和更新,所以可以去掉1中的比较结果集步骤:

  ①找出oracle.A中的所有符合条件的数据;

  ②将上一步找到的数据通过ID字段和MySQL中的对比,做出更新动作;

    *这里的更新包含2层含义:

      *更新:如果ID = ID,ID字段不更新,其他字段更新,即ID更新=N,其他字段更新=Y;

      *新增:如果ID != ID,在以上范围外,新增;

  *可以先同步三条数据到mysql.A;然后再在oracle.A中增加一条数据,修改一条数据的非ID字段,执行下看下效果。

006fRELkly4gpltyicei4j30tj0fvgnb

3.补充说明:若删除了oracle.A中已同步到mysql.A的数据时,执行操作后不会影响mysql.A中的这条数据。

如果大家有其他的方法,或者想要知道哪方面的办公技巧,下方评论哦~

学习资料见知识星球。

以上就是今天要分享的技巧,你学会了吗?若有什么问题,欢迎在下方留言。

快来试试吧,小琥 my21ke007。获取 1000个免费 Excel模板福利​​​​!

更多技巧, www.excelbook.cn

欢迎 加入 零售创新 知识星球,知识星球主要以数据分析、报告分享、数据工具讨论为主;

2022021703525891-21

你将获得:

1、价值上万元的专业的PPT报告模板。

2、专业案例分析和解读笔记。

3、实用的Excel、Word、PPT技巧。

4、VIP讨论群,共享资源。

5、优惠的会员商品。

6、一次付费只需99元,即可下载本站文章涉及的文件和软件。

文章版权声明 1、本网站名称:Excelbook
2、本站永久网址:http://www.excelbook.cn
3、本网站的文章部分内容可能来源于网络,仅供大家学习与参考,如有侵权,请联系站长王小琥进行删除处理。
4、本站一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责。
5、本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报。
6、本站资源大多存储在云盘,如发现链接失效,请联系我们我们会第一时间更新。

THE END
分享
二维码
< <上一篇
下一篇>>