博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
HDFS1.0小记
阅读量:6694 次
发布时间:2019-06-25

本文共 1161 字,大约阅读时间需要 3 分钟。

hot3.png

  1. HDFS概念及作用:HDFS是一个分布式文件式系统。用于存储海量数据,可以存储多种格式文件。
  2. HDFS1.0由3个组件组成,分别是:nameNode,secondaryNameNode,dataNode。
  3. 整个hdfs集群里面有三种角色:主节点、从节点、客户端。
  4. hdfs储存的单元是block,一个block的大小是64M。
  5. 默认一个文件会保存3份。
  6. dataNode主动通过“心跳”,向nameNode汇报自己的空闲状态。
  7. nameNode的职责:
    • 负责客户端的响应。
    • 元数据的管理。
  8. nameNode的元信息持久化: 在nameNode中存放元信息的文件式fsimage。在系统运行期间所有对源信息的操作都保存在内存中并持久化到另一个文件edits中。并且edits文件和fsimage文件会被secondaryNameNode周期性合并。
  9. hdfs致命的缺点:nameNode的点单问题。
  10. dataNode的职责:
    • 负责存储数据块,负责为哭护短提供数据块的读写任务。
    • 根据nameNode的指示进行创建、删除和复制等操作。
    • 心跳机制,定期报告文件块列表信息。
    • dataNode之间进行通信,块的副本处理。
  11. secondaryNameNode:命名不好,secondaryNameNode并不是nameNode的备份。
  12. secondaryNameNode的职责:
    • 定时到nameNode去获取edit logs,并更新到fsimage。
    • 一旦它有了新的fsimage文件,它将其拷贝回nameNode中。(注:secondaryNameNode和nameNode内都有fsimage)
    • nameNode在下次重启时回使用这个新的fsimage文件,从而减少重启时间。
  13. 两个备份文件的作用:
    • fsimage:它是在nameNode启动时对整个文件系统的快照。
    • edits logs:它是在nameNode启动后,对文件系统的更改进行记录。
  14. 数据完整性校验的两种校验方法:
    • 校验和:client通过crc32,在每512个字节创建一个校验码,当校验通过后,dataNode再向block保存数据。
    • 数据块检测程序DataBlockSCanner:在dataNode节点上开启一个后台栈程,来定期验证存储在它上所有块,这个是防止物理介质出现损减情况而造成数据损失。
  15. hdfs常用命令
    • 查看文件 hadoop fs -ls 文件目录
    • 上传文件 hadoop fs -put 上传文件 hdfs位置+文件名称
    • 删除文件 hadoop fs -rmr 文件目录
    • 修改权限(级联) hadoop fs -chmod -r 文件目录

转载于:https://my.oschina.net/u/3746234/blog/2992770

你可能感兴趣的文章
Crimm Imageshop 2.3。
查看>>
SQL AND和OR求值顺序
查看>>
买房必知的五大法律常识 助你安心顺利选房
查看>>
leetcode563
查看>>
剑指Offer 40 最小的k个数
查看>>
winform创建树形菜单的无限级分类
查看>>
面试问题总结
查看>>
HTML特殊转义字符列表
查看>>
2、NIO--缓冲区(Buffer)
查看>>
3、集合--AbstractCollection、AbstractList源码
查看>>
如何较为直观的打印二叉树
查看>>
2014年计划:
查看>>
USACO习题:Broken Necklace
查看>>
打包命令
查看>>
POJ 1679 The Unique MST 【最小生成树/次小生成树模板】
查看>>
什么是动态链接库
查看>>
mysqldump 定时任务 执行后备份的文件为空
查看>>
Python-Django 模型层-单表查询
查看>>
Windows Redis默认配置文件,Redis配置不生效解决方案
查看>>
oracle-------window安装
查看>>