最近有业务需要将oracle的数据抽到greenplum里去。
现在采集的方案是先用sqluldr2导出成csv文件,再通过gpload装载csv文件。
问题是oracle的字段里有换行符 导致在gpload装载时报错。
刚开始是想通过自定义列分隔符来解决问题,但gpload不能自定义列分隔符。后面临时解决的方案是将字段里的换行符替换掉再入库。但这种方式会导致字段值发生变化不符合要求。
又采用将导出时字段进行base64编码,入库后再进行base64解码。但这种方式性能太低了。
请问各位大牛有没有好的解决方案?