forked from Testudinate/Hadoop
-
Notifications
You must be signed in to change notification settings - Fork 0
/
4.1.3.txt
15 lines (10 loc) · 1.06 KB
/
4.1.3.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Текстовый файл состоит из 1000 строк по 10 слов в каждой. При этом в каждой строке каждое слово
встречается 2 раза. Всего файл содержит 100 различных слов.
Сколько пар key / value будет передаваться из Map в Reduce в задаче WordCount в каждом из 3 случаев:
Используется базовый алгоритм маппера
Используется in-mapper combining v.1
Используется in-mapper combining v.2
Весь файл обрабатывается одним маппером. Для входных данных используется класс TextInputFormat.
Т.е. маппер в качестве ключа принимает номер строки, а в качестве значения саму строку.
Ответ напишите в виде 3-х чисел, разделенных пробелом (например: 300 200 100)
10000 5000 100