TokenizerMapper类
TokenizerMapper类的简单介绍
xml文件有很多,每个都有几百M,存储在hdfs上,而且是以gz结尾的文本格式的文件查找时,我是写了一个实现Tool接口,继承自Configured类的MapReduce,这样就可以传入自定义的参数给我的MapReduce程序了需要在文件里Grep的。
日期 2024-04-18 阅 33 TokenizerMapper类
1
xml文件有很多,每个都有几百M,存储在hdfs上,而且是以gz结尾的文本格式的文件查找时,我是写了一个实现Tool接口,继承自Configured类的MapReduce,这样就可以传入自定义的参数给我的MapReduce程序了需要在文件里Grep的。
日期 2024-04-18 阅 33 TokenizerMapper类