博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
hadoop常见算法(持续更新)
阅读量:6156 次
发布时间:2019-06-21

本文共 592 字,大约阅读时间需要 1 分钟。

 

1. 对以下数据进行排序,根据收入减去支出得到最后结余从大到小排序

账号                 收入    支出    日期zhangsan@163.com    6000    0      2014-02-20lisi@163.com        2000    0      2014-02-20lisi@163.com        0       100    2014-02-20zhangsan@163.com    3000    0      2014-02-20wangwu@126.com      9000    0      2014-02-20wangwu@126.com      0       200    2014-02-20

最后结果形式为:

lisi@163.com        2000    100    1900wangwu@126.com      9000    200    8800zhangsan@163.com    9000    0      9000

 

2. 倒排索引、ETL、过滤 (文本查找),解析和校验

 

 

3. Partition的使用

 

 

4. 双下标排序

 

5. 利用MapReduce求解海量数据文件中的最大值

 

 

6. 计数器

 

7. k-means聚类算法

 

 

8. 计数与求和

 

 

 

 

References:

[1]

转载地址:http://bzsfa.baihongyu.com/

你可能感兴趣的文章
LogicalDOC 6.6.2 发布,文档管理系统
查看>>
给PowerShell脚本传递参数
查看>>
实战2——Hadoop的日志分析
查看>>
利用FIFO进行文件拷贝一例
查看>>
Ecshop安装过程中的的问题:cls_image::gd_version()和不支持JPEG
查看>>
resmgr:cpu quantum等待事件
查看>>
一个屌丝程序猿的人生(六十六)
查看>>
Java 编码 UTF-8
查看>>
SpringMVC实战(注解)
查看>>
关于静态属性和静态函数
查看>>
进程的基本属性:进程ID、父进程ID、进程组ID、会话和控制终端
查看>>
spring+jotm+ibatis+mysql实现JTA分布式事务
查看>>
MyBatis启动:MapperStatement创建
查看>>
调查问卷相关
查看>>
eclipse启动无响应,老是加载不了revert resources,或停留在Loading workbench状态
查看>>
1. Git-2.12.0-64-bit .exe下载
查看>>
怎样关闭“粘滞键”?
查看>>
[转]React 教程
查看>>
拓扑排序介绍
查看>>
eclipse打开工作空间(workspace)没有任务反应
查看>>