hadoop默认是按行读取数据的,可是我这里的很多数据占据两行以上,格式不统一,有什么方法才可以方便顺利读取不出错?

2016/12 01 13:12
此文章不得转载,如有需要请联系网站管理员。

一度的温暖,一百度的爱情,来自于sbf999胜博发老虎机的点点滴滴

由于数据比较多,手动排版数据比较费事。

自己写个分析器吧。

自定义分区,可以经过完成InputFormat接口或许承继FileInputFormat类,然后自定义RecordReader,在Driver中添加这个自定义分区这种方法。

(看完/读完)这篇文章有何感想! 来看看sbf999胜博发老虎机是怎么评论的吧!

--转载请注明: sbf999胜博发老虎机_胜博发娱乐老虎机_sbf999胜博发pt娱乐老虎机 » hadoop默认是按行读取数据的,可是我这里的很多数据占据两行以上,格式不统一,有什么方法才可以方便顺利读取不出错?

发表评论

(必填)