tp钱包官网下载

TokenizerMapper类

  • TokenizerMapper类的简单介绍

    TokenizerMapper类的简单介绍

    xml文件有很多,每个都有几百M,存储在hdfs上,而且是以gz结尾的文本格式的文件查找时,我是写了一个实现Tool接口,继承自Configured类的MapReduce,这样就可以传入自定义的参数给我的MapReduce程序了需要在文件里Grep的。

    日期 2024-04-18  阅 22  TokenizerMapper类
1