博客
关于我
Oracle数据泵导出使用并行参数,单个表能否真正的并行?
阅读量:447 次
发布时间:2019-03-06

本文共 621 字,大约阅读时间需要 2 分钟。

对于Oracle Data Pump工具expdp的并行参数,确实可以在特定情况下真正起到并行处理的作用,但其效果取决于表的大小和结构。以下是详细的分析和测试结果:

  • 单个小表的并行测试

    • 当设置parallel=2时,expdp命令并未实际分成两个进程来处理数据。直接路径导出不支持并行,且由于表的大小不足以触发外部表的并行处理,实际上只有一个进程在工作。
    • 这意味着对于小型数据,设置并行参数并不会带来性能提升,反而可能增加资源消耗。
  • 大型非分区表的并行测试

    • 对于非分区表,设置高并行参数如parallel=10时,实际上只有四个进程在工作(一个主进程和三个PX进程)。这表明,表的大小和结构不足以支持更多的PX进程,导致并行效果不明显。
    • 尽管并行参数设置较高,但由于表的数据量和估算大小,PX进程的数量没有达到预期的并行效果。
  • 大型分区表的并行测试

    • 当分区表中的每个分区大小超过250MB时,设置parallel=10会启动十个主进程,每个进程分别处理一个分区。这样,每个分区的数据可以同时被导出,显著提高了总体的导出速度。
    • 这表明,在分区表中,合理的分区大小和并行参数设置可以有效地分配PX进程,从而实现真正的并行处理。
  • 结论

    • 对于单个小型表,或者非分区的大型表,设置并行参数并不会带来显著的性能提升。
    • 对于大型分区表,合理的分区设计和高并行参数设置可以有效提升导出速度。每个分区应超过250MB,以确保足够的PX进程被创建和使用。

    转载地址:http://xxlyz.baihongyu.com/

    你可能感兴趣的文章
    pandas读取parquet报错
    查看>>
    pandas读取数据用来深度学习
    查看>>
    Pandas进阶大神!从0到100你只差这篇文章!
    查看>>
    spring5-介绍Spring框架
    查看>>
    Pandas:如何按列元素的组合分组,以指示基于不同列的值的同现?
    查看>>
    Pandas:将一列与数据帧的所有其他列进行比较
    查看>>
    PANDA:基于多列对数据表的行运行计算,并将输出存储在新列中
    查看>>
    PandoraFMS 监控软件 SQL注入漏洞复现
    查看>>
    PandoraFMS 监控软件 任意文件上传漏洞复现
    查看>>
    Papyrus项目常见问题解决方案
    查看>>
    Parallel.ForEach使用示例
    查看>>
    Parallel.ForEach的基础使用
    查看>>
    parallels desktop for mac安装虚拟机 之parallelsdesktop密钥 以及 parallels desktop安装win10的办公推荐可以提高办公效率...
    查看>>
    parallelStream导致LinkedList遍历时空指针的问题
    查看>>
    Parameter ‘password‘ not found. Available parameters are [md5String, param1, username, param2]
    查看>>
    ParameterizedThreadStart task
    查看>>
    paramiko模块
    查看>>
    param[:]=param-lr*param.grad/batch_size的理解
    查看>>
    Spring Cloud 之注册中心 EurekaServerAutoConfiguration源码分析
    查看>>
    ParseChat应用源码ios版
    查看>>