# WordCount经典案例

需求

需求: 在一堆给定的文本文件中统计输出每一个单词出现的总次数。

# Step1)数据的准备工作

  1. 创建一个新的文件

  2. 向其中放入以下内容并保存

hello,world,hadoop
hive,sqoop,flume,hello
kitty,tom,jerry,world
hadoop
1
2
3
4
  1. 上传到 HDFS
// 在hdfs上创建一个目录。
hdfs dfs -mkdir /wordcount/

// 上传指定文件 到 hdfs的指定目录下。
hdfs dfs -put wordcount.txt /wordcount/
1
2
3
4
5

# Step2)Mapper

Last Updated: 8/4/2024, 10:30:21 AM